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本 书 是 经 典 的 计算 机 网 络 教材 ， 采 用 作者 独创 的 自 项 向 下 方法 来 讲授 计算 机 网 络 的 原理 及 其 协议 ， 
自 第 1 版 出 版 以 来 已 经 被 数 百 所 大 学 和 学 院 选 作 教材 ， 被 译 为 14 种 语言 。 
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改变 了 各 章 的 组 织 结构 ， 将 网 络 层 分 成 两 章 (第 4 章 关 注 网 络 层 的 数据 平面 ， 第 5 章 关 注 网 络 层 的 控制 
平面 )， 并 将 网 络 管理 主题 放 人 新 的 第 5 章 中 。 此 外 ， 为 了 反映 自 第 6 版 以 来 计算 机 网 络 领域 的 新 变化 ， 
对 其 他 章节 也 进行 了 更 新 ， 删 除了 -FTP 和 分 布 式 散 列表 的 材料 ， 用 流行 的 因特网 显 式 拥塞 通告 (ECN) 
材料 代替 了 ATM 网 络 的 材料 ， 更 新 了 有 关 802.11 ( 即 WiFi) 网 络 和 蜂窝 网 络 (包括 4G 和 LTE) 的 
材料 ， 全 面 修订 并 增加 了 新 的 课 后 习题 ， 等 等 。 
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文艺 复兴 以 来 ， 源 远 流 长 的 科学 精神 和 逐步 形成 的 学 术 规 范 ， 使 西方 国家 在 自然 科学 
的 各 个 领域 取得 了 垄断 性 的 优势 ; 也 正 是 这 样 的 优势 ， 使 美国 在 信息 技术 发 展 的 六 十 多 年 
间 名 家 辈出 、 独 领 风骚 。 在 商业 化 的 进程 中 ， 美 国 的 产业 界 与 教育 界 越 来 越 紧密 地 结合 ， 
计算 机 学 科 中 的 许多 泰山 北斗 同时 身 处 科研 和 教学 的 最 前 线 ， 由 此 而 产生 的 经 典 科学 著 
作 ， 不 仅 璧 划 了 研究 的 范畴 ， 还 揭示 了 学 术 的 源 变 ， 既 遵循 学 术 规范 ， 又 自 有 学 者 个 性 ， 
其 价值 并 不 会 因 年 月 的 流逝 而 减退 。 

近年 ， 在 全 球 信息 化 大 潮 的 推动 下 ,我 国 的 计算 机 产业 发 展 迅 猛 ， 对 专业 人 才 的 需求 
日 益 迫 切 。 这 对 计算 机 教育 界 和 出 版 界 都 既是 机 遇 ， 也 是 挑战 ; 而 专业 教材 的 建设 在 教育 
战略 上 显得 举足轻重 。 在 我 国信 息 技 术 发 展 时 间 较 短 的 现状 下 ， 美 国 等 发 达 国 家 在 其 计算 
机 科学 发 展 的 几 十 年 间 积 淀 和 发 展 的 经 典 教材 仍 有 许多 值得 借鉴 之 处 。 因 此 ， 引 进 一 批 国 
外 优秀 计算 机 教材 将 对 我 国 计 算 机 教育 事业 的 发 展 起 到 积极 的 推动 作用 ， 也 是 与 世界 接 
轨 、 建 设 真正 的 世界 一 流 大 学 的 必由之路 。 

机 械 工 业 出 版 社 华章 公司 较 早 意识 到 “ 出 版 要 为 教育 服务 "。 自 1998 年 开始 ， 我 们 就 
将 工作 重点 放 在 了 和 游 选 、 移 译 国外 优秀 教材 上 。 经 过 多 年 的 不 懈 努 力 ， 我 们 与 Pearson ， 
McGraw-Hill, Elsevier, MIT, John Wiley & Sons, Cengage 等 世界 著名 出 版 公司 建立 了 良好 的 
合作 关系 ， 从 他 们 现 有 的 数 百 种 教材 中 甄选 出 Andrew S. Tanenbaum, Bjarne Stroustrup, 
Brian W. Kernighan, Dennis Ritchie, Jim Gray, Afred V. Aho, John E. Hopcroft, Jeffrey 
D. Ullman, Abraham Silberschatz, William Stallings, Donald E. Knuth, John L. Hennessy, Larry 
L. Peterson 等 大 师 名 家 的 一 批 经 典 作品 ， 以 “计算 机 科学 丛书 ”为 总 称 出 版 ， 供 读者 学 
习 、 研 究 及 珍藏 。 大 理 石 纹理 的 封面 ， 也 正体 现 了 这 套 丛 书 的 品位 和 格调 。 

“计算 机 科学 丛书 ”的 出 版 工作 得 到 了 国内 外 学 者 的 易 力 相助 ， 国 内 的 专家 不 仅 提供 了 
中 肯 的 选 题 指导 ， 还 不 辞 劳苦 地 担任 了 翻译 和 审 校 的 工作 ; 而 原 书 的 作者 也 相当 关注 其 作品 
在 中 国 的 传播 ， 有 的 还 专门 为 其 书 的 中 译本 作 序 。 迄 今 , “计算 机 科学 丛书 ”已 经 出 版 了 近 
两 百 个 品种 ， 这 些 书 籍 在 读者 中 树立 了 良好 的 口碑 ， 并 被 许多 高 校 采用 为 正式 教材 和 参考 书 
籍 。 其 影印 版 “经 典 原版 书库 ”作为 姊妹 篇 也 被 越 来 越 多 实施 双语 教学 的 学 校 所 采用 。 

权威 的 作者 、 经 典 的 教材 、 一 流 的 译 者 、 严 格 的 审 校 、 精 细 的 编辑 ， 这 些 因素 使 我 们 
的 图 书 有 了 质量 的 保证 。 随 着 计算 机 科学 与 技术 专业 学 科 建 设 的 不 断 完善 和 教材 改革 的 逐 
渐 深 化 ， 教 育 界 对 国外 计算 机 教材 的 需求 和 应 用 都 将 步 人 一 个 新 的 阶段 ,我 们 的 目标 是 尽 
善 尽 美 ， 而 反馈 的 意见 正 是 我 们 达到 这 一 终极 目标 的 重要 帮助 。 华 章 公司 欢迎 老师 和 读者 
对 我 们 的 工作 提出 建议 或 给 予 指正 ,我 们 的 联系 方法 如 下 : 


华章 网 站 : www. hzbook. com 
电子 邮件 :hzjsj@ hzbook. com 
联系 电话 : (010)88379604 
联系 地 址 : 北京 市 西城 区 百 万 庄 南 街 1 号 华章 教育 

邮政 编码 : 100037 华章 科技 图 书 出 版 中 心 
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James F. Kurose 是 美国 马萨诸塞 大 学 阿 默 斯 特 分校 杰 出 的 计算 机 
科学 教授 。 他 目前 担任 美国 国家 科学 基金 会 的 副 主 任 ， 领 导 计 算 机 和 
信息 科学 工程 理事 会 。 

Kurose 博士 在 教育 领域 的 活动 获得 了 许多 赞誉 ， 其 中 包括 国立 技 
术 大 学 (8 次 ) 、 马 萨 诸 塞 大 学 和 研究 生 院 东北 联合 会 杰出 教师 奖 。 他 
获得 了 IEEE Taylor Booth 教育 奖章 ， 从 而 确立 了 他 在 马萨诸塞 共同 体 
信息 技术 促进 会 的 领导 地 位 。 他 多 次 赢得 优秀 会 议论 文 奖 并 获得 IEEE 
Infocom 成 就 奖 和 ACM Sigcomm 的 时 间 考 验 奖 。 

Kurose 博士 是 《IEEE 通信 会 刊 》(IEEE Transactions on Communications ) #1] IEEE/ACM 
网 络 会 刊 》(IEEEXACM Transactions on Networking) 的 前 任 总 编辑 。 他 担任 了 IEEE Infocom, 
ACM SIGCOMM, ACM 因特网 测量 会 议和 ACM SIGMETRICS 的 技术 程序 的 共同 主席 。 他 是 
IEEE 会 士 (Fellow) 和 ACM 会 士 。 他 的 研究 兴趣 包括 网 络 协议 和 体系 结构 、 网 络 测量 、 多 
媒体 通信 以 及 建 模 和 性 能 评价 。 他 拥有 哥伦比亚 大 学 计算 机 科学 的 博士 学 位 。 

Keith W. Ross 是 美国 纽约 大 学 (NYU) 上 海 分 校 工程 和 计算 机 科学 
学 院 院 长 以 及 NYU 计算 机 科学 和 工程 系 的 Leonard J. Shustek 首席 教 
授 。 在 此 之 前 ， 他 就 职 于 宾夕法尼亚 大 学 (13 年 ) Eurecom 学 院 (5 
年 ) 和 理工 大 学 (10 年 ) 。 他 从 Tufts 大 学 获得 电气 工程 学 士 学 位 ， 从 哥 
伦比 亚 大 学 获得 电气 工程 硕士 学 位 ， 从 密 吹 根 大 学 获得 计算 机 和 控制 
工程 博士 学 位 。Ross 也 是 Wimba 公司 奠基 人 和 首 任 CEO ， 该 公司 为 电 
子 学 习 研 发 了 在 线 多 媒体 应 用 并 于 2010 年 被 Blackboard 收购 。 

Ross 教授 的 研究 兴趣 在 隐私 、 社 交 网 络 、 对 等 (P2P) 网 络 、 因 特 网 测量 、 内 容 分 发 网 和 
随机 建 模 等 方面 。 他 是 ACM A&A IEEE 会 士 ， 获 得 了 Infocom 2009 年 优秀 论文 奖 ， 并 且 获 
得 《多 媒体 通信 》2011 年 和 2008 年 优秀 论文 奖 ( 由 IEEE 通信 学 会 授予 ) 。 他 担任 多 个 杂志 
委 和 会 议程 序 委员 会 委员 ， 包 括 《IEEE/ ACM 网 络 会 刊 》、ACM SIGCOMM, ACM CoNext 和 
ACM 因特网 测量 会 议 。 他 还 担任 联邦 贸易 委员 会 P2P 文件 共享 方面 的 顾问 。 

陈 鸣 ， 南 京 航空 航天 大 学 特聘 教授 、 研 究 生 导师 ; 分 别 于 1982 
年 、1988 年 在 解放 军 信 息 工 程 学 院 获得 学 士 、 硕 士 学 位 ， 于 1991 年 
在 解放 军 通 信 工 程 学 院 获得 博士 学 位 ，1999 ~ 2000 年 为 美国 哥伦比亚 
大 学 访问 科学 家 ， 现 在 任 中 国 计 算 机 学 会 网 络 与 数据 通信 专 委 会 副 主 
任 ， 是 中 国 通信 学 会 等 多 个 学 术 团体 委员 和 IEEE 会 员 ; 长 期 从 事 网 络 
测量 、 分 布 式 系统 、 未 来 网 络 、 网 络 安 全 等 领域 研究 和 教学 工作 ， 近 
期 研究 兴趣 包括 无 人 机 网 络 、 软 件 定义 网 络 、 网 络 功能 虚拟 化 ; 承担 
了 国家 自然 科学 基金 、 国 家 863 、 国 家 973 子 课题 等 项 目 ; 开发 的 多 个 
网 络 管理 系统 和 应 用 系统 在 多 个 领域 得 到 广泛 应 用 ; 撰写 网 络 著 作 近 10 本， 发 表 SCL/EI 
论文 几 十 篇 ， 有 国家 发 明 专 利 10 项 ; 获得 国家 教学 成 果 二 等 奖 1 项 和 省 部 级 科技 进步 二 、 
三 等 奖 十 几 项 。 
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FR A 2003 年 起 翻译 Kurose 和 Ross 两 位 教授 合 著 的 《计算 机 网 络 : 自 顶 向 下 方法 》 教 科 
书 ， 至 今 已 经 过 去 15 个 年 头 了 。 连 续 六 次 翻译 这 本 计算 机 网 络 经 典 教科 书 为 我 提供 了 难 
得 的 学 习 机 会 ， 使 我 能 够 静 下 心 来 思考 他 们 的 所 思 所 想 ， 洞 察 他 们 对 技术 发 展 的 分 析 ， 品 
味 他 们 讲解 网 络 原理 时 的 遗 词 造句 。 尽 管 我 们 能 够 从 多 种 来 源 学 习 、 研 究 网 络 技 术 ， 但 是 
通过 这 本 书 ， 我 们 能 够 系统 地 理解 错综复杂 的 网 络 技术 是 如 何 组 织 成 为 复杂 的 网 络 系统 
的 ， 观 察 到 新 型 网 络 技术 是 如 何 替 代 过 时 技术 的 ， 感 受到 一 些 网 络 术 语 是 如 何 悄 然 变 化 
的 ， 学 习 大 师 级 人 物 是 如 何 创 新 网 络 教学 的 …… 总 之 ， 这 本 教科 书 被 称 为 世界 上 非常 流 
行 、 非 常 优秀 的 网 络 教 科 书 的 确 当之无愧 。 同 时 ,该 书 的 中 译本 有 助 于 我 国 高 校 学 生 、 科 
技工 作者 以 及 其 他 读者 高 效 地 学 习 计算 机 网 络 知识 (而 不 是 英文 !) ， 进 一 步 促 进 我 国 网 络 
教学 水 平 的 提升 。 

软件 定义 网 络 (SDN ) 的 发 展 是 网 络 界 近 年 来 非常 重要 和 令 人 兴奋 的 事件 ， 本 书 首次 用 
两 章 的 篇 幅 讨论 网 络 层 一 一 第 4 章 讨论 网 络 层 的 数据 平面 ， 第 5 章 讨论 网 络 层 的 控制 平面 
和 网 络 管理 主题 。 与 以 前 的 版 本 一 样 ， 本 书 与 时 俱 进 地 更 新 了 许多 章节 的 内 容 、 习 题 和 网 
站 的 配套 资料 ， 反 映 了 网 络 技术 日 新 月 异 的 发 展 。 

在 本 书 的 翻译 过 程 中 ， 译 者 得 到 了 南京 航空 航天 大 学 计算 机 科学 与 技术 学 院 的 领导 和 
同事 的 支持 和 帮助 。 本 书 的 责任 编辑 刘 立 狠 、 迟 振 春 出 色 的 专业 技能 和 耐心 细致 也 使 本 书 
增色 。 

限于 时 间 和 学 识 ， 译文 错漏 难免 ， 请 识 者 不 音 赐教 。 请 将 问题 发 送 给 mingchennj@ 

163. com， 我 将 及 时 反馈 读者 。 


陈 鸣 
南京 航空 航天 大 学 计算 机 科学 与 技术 学 院 


前 言 | 


Computer Networking; A Top-Down Approach, Seventh Edition 


欢迎 阅读 《计算 机 网 络 : 自 顶 向 下 方法 》 的 第 7 版 。 自 从 本 书 第 1 版 于 16 年 前 出 版 以 
来 ， 这 本 书 已 经 被 数 百 所 大 学 和 学 院 采 用 ， 被 译 为 14 种 语言 ， 并 被 世界 上 几 十 万 的 学 生 
和 从 业 人 员 使 用 。 我 们 倾听 了 许多 读者 的 意见 ， 装 扬 之 声 不 绝 于 耳 。 


第 7 版 的 新 颖 之 处 


我 们 认为 本 书 成 功 的 一 个 重要 原因 是 ， 持 续 地 为 计算 机 网 络 教学 提供 了 一 种 新 颖 和 与 
时 俱 进 的 方法 。 在 第 7 版 中 ,我 们 做 了 不 少 改变 ,但 也 保持 了 我 们 认为 (并 且 得 到 了 使 用 
本 书 的 教师 和 学 生 的 认可 ) 本 书 最 为 重要 的 方面 : 它 的 自 顶 向 下 方法 ， 它 关注 因特网 和 计 
算 机 网 络 的 现代 处 理 方式 ， 它 的 注重 原理 和 实践 ， 以 及 它 易于 理解 的 风格 和 学 习 计 算 机 网 
络 的 方法 。 然 而 ， 第 7 版 进行 了 相当 多 的 修订 和 更 新 。 

本 书 的 长 期 读者 将 注意 到 ， 自 该 教科 书 出 版 以 来 ， 我 们 首次 改变 了 各 章 的 组 织 结构 。. 
以 往 包 括 在 一 章 中 的 网 络 层 ， 现 在 包括 在 第 4 章 ( 该 章 关注 网 络 层 的 所 谓 “ 数 据 平面 "组 
件 ) 和 第 5 章 ( 该 章 关 注 网 络 层 的 “控制 平面 " ) 中 。 网 络 层 范 围 的 扩展 反映 了 软件 定义 网 络 
(SDN) 重 要 性 的 迅速 提升 ， 无 可 置疑 地 证 明了 十 年 来 网 络 非常 重要 和 令 人 兴奋 的 进展 。 尽 
管 SDN 是 相对 新 近 的 创新 ,但 它 已 经 迅速 在 实践 中 得 到 应 用 ， 所 以 介绍 现代 计算 机 网 络 
而 不 涉及 SDN 已 经 成 为 不 可 想象 的 事 。 先 前 包括 在 第 9 章 中 的 网 络 管理 主题 ， 现 在 已 经 放 
人 新 的 第 5 章 中 了 。 我 们 一 如 既往 地 更 新 了 本 书 的 许多 其 他 章节 ， 以 反映 自 第 6 版 以 来 网 
络 领 域 的 新 变化 。 从 教科 书 中 撤除 的 材料 一 如 既往 地 能 够 在 本 书 的 配套 网 站 中 找到 。 比 较 
重要 的 一 些 更 新 如 下 : 

。 为 反映 因特网 不 断 增长 的 范围 和 应 用 ， 更 新 了 第 1 章 。 

。 讨论 应 用 层 的 第 2 章 进行 了 重大 更 新 。 我 们 删除 了 FTP 和 分 布 式 散 列表 的 材料 ， 
增加 了 有 关 应 用 层 视 频 流 和 内 容 分 发 网 ， 以 及 Netflix 和 YouTube 学 习 案例 的 新 节 。 
套 接 字 编程 已 从 Python 2 更 新 为 Python 3。 
讨论 运输 层 的 第 3 章 进 行 了 适度 更 新 。 异 步 传递 方式 (ATM ) 网 络 的 材料 已 被 更 流 
行 的 因特网 显 式 拥 塞 通 告 (ECN ) 的 材料 所 代替 ， 用 ECN 教授 相同 的 原理 。 

第 4 章 讨论 网 络 层 的 “数据 平面 组件。 数据 平面 是 每 台 路 由 器 的 转发 功能 ， 它 决 

定 到 达 路 由 器 的 一 条 输入 链 路 的 分 组 是 如 何 转发 到 该 路 由 器 的 一 条 输出 链 路 的 。 

我 们 更 新 了 在 所 有 前 面 版 本 中 都 能 找到 的 有 关 传 统 因 特 网 转发 的 材料 ， 并 且 增 加 

了 分 组 调度 的 材料 。 还 增加 了 有 关 通 用 转发 的 新 节 ， 就 像 SDN 中 实践 的 那样 。 该 

章 也 有 很 多 更 新 。 有 关 多 播 和 广播 通信 方面 的 材料 已 被 删除 。 

。 第 5 章 讨论 网 络 层 的 控制 平面 功能 。 这 种 网 络 范围 的 逻辑 控制 着 数据 报 如 何 沿 着 
从 源 主 机 到 目的 主机 的 路 由 器 的 端 到 端 路 径 选 择 路 由 。 如 同 前 面 版 本 一 样 ， 我 们 
包括 路 由 选择 算法 以 及 在 今天 的 因特网 中 所 使 用 的 路 由 选择 协议 (更 新 了 对 BGP 
的 讨论 ) 。 增 加 了 有 关 SDN 控制 平面 的 新 节 ， 讲 述 了 如 何在 所 谓 的 SDN 控制 器 中 
实现 路 由 选择 和 其 他 功能 。 


Vil 


。 第 7 章 讨论 无 线 网 络 和 移动 网 络 ， 更 新 了 有 关 802. 11( 所 谓 Wiki) 网 络 和 蜂窝 网 
络 (包括 4C 和 LIE) 的 材料 。 

。 第 8 章 讨论 网 络 安全 ， 这 在 第 6 版 中 已 经 全 面 更 新 过 了 ， 本 版 中 该 章 仅 进行 了 适 
度 更 新 。 

。 第 9 章 较 之 第 6 版 进行 了 适度 调整 ， 有 关 视 频 流 和 内 容 分 发 网 的 材料 已 经 放 到 第 2 
章 了 ， 有 关 分 组 调度 的 材料 已 经 放 进 第 4 章 了 。 

。 增加 了 与 每 章 后 面 习 题 相 关 的 重要 新 材料 。 与 前 面 各 版 一 样 ， 对 课 后 习题 进行 了 
修订 、 增 加 和 删除 。 

在 新 版 本 的 修订 过 程 中 ， 我 们 的 目标 一 如 既往 ， 继 续 关 注 因特网 和 计算 机 网 络 的 现代 

处 理 方式 ， 注 重 原 理 和 实践 。 


本 书 读者 对 象 


本 书 适用 于 计算 机 网 络 的 第 一 门 课程 ， 既 可 用 于 计算 机 科学 系 的 学 生 ， 也 可 用 于 电气 
工程 系 的 学 生 。 就 编程 语言 而 言 ， 本 书 仅 假定 学 生 具 有 C, C++, Java 或 Python 的 编程 经 
验 (也 只 是 在 几 个 地 方 用 到 ) 。 与 许多 人 门 性 的 其 他 计算 机 网 络 教科 书 相 比 ， 尽 管 本 书 表述 
更 为 精确 ， 分 析 更 为 细致 ， 然 而 书 中 很 少 用 到 高 中 阶段 没有 教 过 的 数学 概念 。 我 们 有 意 避 
免 使 用 任何 高 等 微 积分 、 概 率 论 或 随机 过 程 的 概念 (尽管 我 们 为 具有 这 种 高 级 背景 的 学 生 
准备 了 某 些 课 后 习题 ) 。 因 此 ， 本 书 适用 于 本 科 生 课程 和 一 年 级 研究 生 课 程 。 它 对 于 电信 
业 的 从 业 人 员 也 应 当 有 用 。 


本 书 的 独特 之 处 


计算 机 网 络 这 门 课程 极为 复杂 ， 涉 及 许多 以 错综复杂 的 方式 彼此 交织 的 概念 、 协 议和 
技术 。 为 了 处 理 这 种 大 跨度 和 高 复杂 性 ， 许 多 计算 机 网 络 教科 书 都 围绕 计算 机 网 络 体系 结 
构 的 “层次 "来 组 织 内 容 。 借 助 于 这 种 分 层 的 组 织 结构 ， 学 生 能 够 透 过 计算 机 网 络 的 复杂 性 
看 到 其 内 部 ， 他 们 在 学 习 整 个 体系 结构 的 某 个 部 分 中 的 独特 概念 和 协议 的 同时 ， 也 能 看 清 
所 有 这 些 部 分 如 何 整 合 在 一 起 的 全 貌 。 从 教学 法 的 角度 来 看 ， 我 们 的 个 人 体验 是 这 种 分 层 
的 教学 方法 的 确 是 卓有成效 的 。 尽 管 如 此 ， 我 们 发 现 那 种 自 底 向 上 的 传统 教学 方法 ， 即 从 
物理 层 到 应 用 层 逐 层 进 行 讲解 的 方法 ， 对 于 现代 计算 机 网 络 课程 并 非 是 最 佳 的 方法 。 


自 顶 向 下 方法 


本 书 于 16 年 前 首次 以 自 顶 向 下 的 方式 来 对 竺 网络， 这 就 是 说 从 应 用 层 开始 向 下 一 直 
讲 到 物理 层 。 我 们 从 教师 以 及 学 生 那 里 得 到 的 反馈 证 实 了 这 种 自 顶 向 下 方法 有 许多 好 处 ， 
并 且 从 教学 法 来 讲 的 确 很 好 实施 。 第 一 ， 它 特别 强调 应 用 层 ( 它 是 网 络 中 的 “高 增长 领 
W) 。 的 确 ， 计 算 机 网 络 中 的 许多 近期 革命 都 发 生 在 应 用 层 ， 其 中 包括 Web 、 对 等 文件 共 
享 和 媒体 流 。 及 早 强调 应 用 层 的 问题 与 大 多 数 其 他 教科 书 中 所 采取 的 方法 不 同 ， 那 些 教科 
书 中 只 有 少量 有 关 网 络 应 用 、 网 络 应 用 的 需求 、 应 用 层 范 式 ( 例 如 客户 - 服务 器 和 对 等 方 
到 对 等 方 ) 以 及 应 用 编程 接口 方面 的 内 容 。 第 二 ， 我 们 (和 使 用 本 书 的 许多 教师 ) 作为 教师 
的 经 验 是 ， 在 课程 开始 后 就 教授 网 络 应 用 的 内 容 ， 是 一 种 有 效 激励 学 习 积 极 性 的 工具 。 学 
生 急 于 知道 诸如 电子 邮件 和 Web 等 网 络 应 用 是 如 何 工作 的 ， 这 些 应 用 是 多 数学 生 每 天 都 


在 使 用 的 东西 。 一旦 理解 了 这 些 应 用 ， 学 生 便 能 够 理解 支持 这 些 应 用 的 网 络 服务 ， 接 下 来 
则 会 仔细 思考 在 较 低 层次 中 可 能 提供 和 实现 这 些 服务 的 各 种 方式 。 因 此 ， 及 早 地 涉及 应 用 
程序 能 够 激发 学 生 学 习 本 书 其 余部 分 的 积极 性 。 

第 三 ， 自 顶 向 下 方法 使 得 教师 能 够 在 教学 的 早期 阶段 介绍 网 络 应 用 程序 的 开发 。 学 生 
不 仅 能 够 明白 流行 的 应 用 程序 和 协议 的 工作 原理 ， 还 能 学 习 到 创造 自己 的 网 络 应 用 程序 和 
应 用 级 协议 是 多 么 容易 。 采 用 自 项 向 下 的 方法 后 ， 学 生 能 够 及 早 地 搞 清楚 套 接 字 编程 、 服 
务 模型 和 协议 的 概念 ， 这 些 重要 概念 为 后 续 各 层 的 讨论 做 了 铺垫 。 通 过 提供 用 Python 语言 
写成 的 套 接 字 编 程 的 例子 ， 我 们 强调 主要 思想 ， 而 不 会 使 学 生 陷于 复杂 代码 的 困境 。 电 气 
工程 和 计算 机 科学 系 的 本 科 生 理解 这 些 代 码 应 当 不 会 有 困难 。 


以 因特网 为 研究 目标 


尽管 自 第 4 版 起 我 们 从 书 名 中 去 掉 了 “Featuring the Internet” (描述 因特网 特色 ) 这 个 短 
语 , 但 这 并 不 意味 着 我 们 不 再 关注 因特网 ! 的 确 ， 一切 如 初 ! 而 且 由 于 因特网 已 经 变 得 无 
所 不 在 ,我 们 反而 认为 任何 网 络 教科 书 都 必须 非常 关注 因特网 ， 因 此 该 短语 在 某 种 程度 上 
已 经 没有 必要 了 。 我 们 继续 使 用 因特网 的 体系 结构 和 协议 作为 基本 载体 来 学 习 基本 的 计算 _ 
机 网 络 概念 。 当 然 ， 我 们 也 能 把 概念 和 协议 放 入 其 他 网 络 体系 结构 中 讲解 。 但 是 我 们 的 关 
注 焦点 是 因特网 ， 这 反映 在 我 们 围绕 因特网 体系 结构 的 5 层 模型 来 组 织 材料 ， 这 5 个 层次 
是 应 用 层 、 运 输 层 、 网 络 层 、 链 路 层 和 物理 层 。 

聚焦 因特网 的 另 一 个 好 处 是 ， 大 多 数 计算 机 科学 和 电气 工程 的 学 生 急切 地 希望 学 习 因 
特 网 及 其 协议 。 他 们 知道 因特网 是 一 种 革命 性 和 破坏 性 的 技术 ， 正 在 深刻 地 改变 着 我 们 的 
世界 。 有 了 对 因特网 大 量 中 肯 的 认识 后 ， 学 生 自然 而 然 会 对 学 习 其 内 部 原理 有 了 求知 欲 。 
因此 ， 教 师 用 因特网 作为 导向 焦点 ， 就 易于 调动 学 生 学 习 基本 原理 的 积极 性 了 。 


教授 网 络 原理 


本 书 的 两 个 独特 之 处 是 自 顶 向 下 方法 和 关注 因特网 ， 这 已 经 显现 在 本 书 的 书 名 中 。 如 
果 我 们 在 副 书 名 中 强行 增加 第 三 个 词 的 话 ， 原 理 一 词 将 包括 在 其 中 。 网 络 领域 已 经 发 展 得 
相当 成 熟 ， 能 够 认识 清楚 许多 基础 性 的 重要 问题 。 例 如 ， 在 运输 层 ， 基 础 性 问题 包括 建立 
在 不 可 靠 的 网 络 层 上 的 可 靠 通 信 、 连 接 建 立 / 拆 除 与 握手 、 拥 塞 和 流量 控制 以 及 多 路 复 用 。 
三 个 非常 重要 的 网 络 层 问题 是 ， 在 两 台 路 由 器 之 间 找 到 "好 的 ”路径 、 互 联 大 量 的 异 构 网 络 
和 管理 现代 网 络 的 复杂 性 。 在 链 路 层 ， 基 础 性 问题 是 共享 多 路 访问 信道 。 在 网 络 安全 中 ， 
提供 机 密 性 、 鉴 别 和 报 文 完整 性 的 技术 都 基于 密码 学 基本 理论 。 本 书 在 指明 基础 性 网 络 问 
题 的 同时 ， 也 会 介绍 解决 这 些 问题 的 方法 。 学 习 这 些 原 理 的 学 生 将 获得 具有 长 “保质 期 "的 
知识 ， 在 今天 的 网 络 标准 和 协议 已 经 变 得 过 时 后 的 很 长 时 间 ， 其 中 的 原理 将 仍然 重要 和 中 
肯 。 我 们 相信 ， 用 因特网 将 学 生 引 入 网 络 之 门 后 ， 再 强调 基础 性 问题 及 其 解决 方案 ， 这 种 
两 者 结合 的 方法 将 使 他 们 迅速 理解 几乎 任何 网 络 技术 。 


‘Web 站 点 


本 书 配 套 的 Web 站 点 位 于 http://www. pearsonhighered. com/cs-resources/。 该 站 点 
包括 : 


e 交互 式 学 习 材 料 。 本 书 的 配套 网 站 包括 视频 要 点 (VideoNotes) ， 即 由 作者 制作 
的 全 书 重要 主题 的 视频 呈现 ， 以 及 对 习题 解答 的 简要 讲解 ， 这 些 习 题 类 似 于 
每 章 后 面 的 习题 。 我 们 已 经 在 Web 站 点 上 提供 了 第 1 ~5 章 的 视频 要 点 和 在 线 
习题 ， 并 且 将 随 着 时 间 的 推移 而 继续 积极 地 增加 和 更 新 这 些 材料 。 如 在 前 面 
版 本 中 一 样 ， 该 Web 站 点 包含 了 交互 式 Java 小 程序 ， 以 动画 方式 显示 了 重要 
的 网 络 概念 。 该 站 点 也 包括 交互 式 小 测验 ， 人 允许 学 生 检查 他 们 对 该 专题 内 容 
的 基本 理解 。 教 授 能 够 将 这 些 交互 式 特色 结合 到 他 们 的 讲义 中 或 将 它们 用 作 
小 实验 。 

e 附加 的 技术 材料 。 由 于 我 们 在 本 书 的 每 个 版 本 中 都 增加 了 新 材料 ， 故 我 们 不 得 不 
删 去 某 些 现 有 主题 以 保持 篇 幅 的 合理 。 例 如 ， 为 了 在 本 版 中 为 新 材料 腾 出 空间 ， 
我 们 删除 了 有 关 FTP、 分 布 式 散 列表 和 多 播 方面 的 材料 。 出 现在 本 书 较 早 版 本 中 
的 材料 仍然 是 有 益 的 ， 并 且 能 够 在 本 书 Web 网 站 上 找到 。 

© 编程 作业 。Web 网 站 也 提供 了 一 些 详细 的 编程 作业 ， 这 些 编程 作业 包括 构建 
一 台 多 线程 Web 服务 器 ， 构 建 一 个 具有 图 形 用 户 接口 (GUI) 的 电子 邮件 客户 ， 
以 及 发 送 端 和 接收 端 可 靠 数据 传输 协议 的 编程 ， 分 布 式 路 由 选择 算法 的 编程 ， 
等 等 。 

e Wireshark 实验 。 通 过 观察 网 络 协议 的 实际 运行 ， 读 者 能 够 大 大 加 深 对 它们 的 理 
解 。 该 Web 站 点 提供 了 许多 Wireshark 作业 ， 使 学 生 能 够 实际 观察 两 个 协议 实体 
之 间 报 文 的 交换 顺序 。 该 Web 站 点 包括 了 有 关 HTTP, DNS, TCP, UDP, IP, IC- 
MP、 以 太 网 、ARP、WiFi 和 SSL 的 单独 Wireshark 实验 ， 以 及 在 跟踪 一 个 获取 
Web 网 页 的 请 求 时 所 涉及 的 所 有 协议 的 Wireshark 实验 。 随 着 时 间 的 推移 ， 我 们 将 
继续 增加 新 的 实验 。 

除了 配套 网 站 外 ， 作 者 维护 了 一 个 公共 网 站 http ://gaia. cs. umass. edu/kurose_rossVin- 


”teractive， 该 网 站 包括 交互 式 练习 ， 这 些 练习 能 够 生成 与 每 章 后 面 所 选 习题 类 似 的 问题 


(并 给 出 解答 ) 。 由 于 学 生 能 够 产生 无 数 类 似 问 题 的 实例 并 看 到 解答 ， 所 以 他 们 能 够 练习 到 
真正 掌握 为 止 。 


教学 特色 


我 们 每 位 作者 都 教 了 30 多 年 的 计算 机 网 络 课程 ， 这 本 书 凝 聚 了 我 们 总 共 60 多 年 教 
了 刀 千 名 学 生 的 教学 经 验 。 在 此 期 间 ， 我们 也 成 为 计算 机 网 络 领 域 活路 的 研究 人 员 。 
(事实 上 James 和 Keith 于 1979 年 在 哥伦比亚 大 学 彼此 相识 ， 共 同 选 了 由 Mischa Schw- 
artz 执教 的 硕士 研究 生计 算 机 网 络 课程 。) 所 有 这 些 都 让 我 们 对 网 络 现状 和 网 络 未 来 的 
可 能 发 展 方向 有 了 良好 的 观察 力 。 无 论 如 何 ， 我 们 在 组 织 这 本 书 的 材料 时 ， 抵 御 住 了 偏 
向 自己 所 钟爱 的 研究 项 目的 诱惑 。 如 果 你 对 我 们 的 研究 工作 感 兴趣 的 话 ， 可 以 访问 我 们 
的 个 人 Web 网站。 因此， 这 是 一 本 关于 现代 计算 机 网 络 的 书 ， 即 该 书包 含 了 当代 协议 
和 技术 以 及 支撑 这 些 协议 和 技术 的 基本 原理 。 我 们 也 认为 学 习 (和 讲授 ) 网 络 是 令 人 
开心 的 事 。 本 书 中 包括 的 幽默 、 使 用 的 类 比 和 现实 世界 的 例子 将 有 望 使 这 些 材料 更 具 趣 
味 性 。 


教师 的 补充 材料 ” 


我 们 提供 了 一 套 完 整 的 补充 材料 ， 以 帮助 教师 教授 这 门 课程 。 这 些 材 料 都 能 通过 访问 
Pearson 的 教师 资源 中 心 (http://www. pearsonhighered. com/irc) 得 到 。 有 关 获 取 这 些 教师 
补充 材料 的 信息 可 访问 教师 资源 中 心 。 
© PowerPoint 幻灯 片 。 我 们 提供 了 全 部 9 章 的 PowerPoint 幻灯 片 。 这 些 幻 灯 片 根据 
第 7 版 进行 了 彻底 更 新 ， 详 细 地 涵盖 了 每 章 的 内 容 。 幻 灯 片 中 使 用 了 图 片 和 动 
m (而 非 仅 是 单调 的 文本 标题 ) ， 这 使 得 它们 有 趣 且 在 视觉 上 有 吸引 力 。 我 们 向 
教师 提供 了 原始 的 幻灯 片 ， 使 得 教师 能 够 做 个 性 化 修改 以 满足 自己 的 教学 需要 。 
这 些 幻 灯 片 中 的 某 些 部 分 就 是 由 采用 本 书 进行 教学 的 教师 所 贡献 的 。 

e 课 后 习题 解答 。 我 们 提供 了 本 书 中 课 后 习题 的 解 题 手册 、 编 程 作业 和 Wireshark 实 
验 。 如 前 所 述 ， 我 们 在 本 书 的 前 6 章 中 引入 了 许多 新 的 课 后 作业 。 


各 章 间 的 关联 性 


本 书 的 第 1 章 提供 了 对 计算 机 网 络 自 包 含 的 概述 。 该 章 介 绍 了 许多 重要 的 概念 与 术 © 
语 ， 为 本 书 的 其 余部 分 葛 定 了 基础 。 其 他 所 有 章 都 直接 依赖 于 第 1 章 的 内 容 。 在 讲解 完 第 
1 章 之 后 ， 我 们 推荐 按 顺序 讲解 第 2 ~6 章 的 内 容 ， 这 样 就 遵循 了 自 顶 向 下 的 原则 。 第 2 ~ 
6 章 中 每 一 章 都 会 用 到 前 面 章节 的 内 容 。 在 完成 前 6 章 的 教学 后 ， 教 师 就 有 了 相当 大 的 灵 
活性 。 最 后 3 章 之 间 没 有 任何 相关 性 ， 因 此 能 够 以 任何 顺序 进行 教学 。 然 而 ， 最 后 3 章 中 
的 每 一 章 都 依赖 于 前 6 章 中 的 材料 。 许 多 教师 采用 的 教学 方案 是 : 教授 前 6 章 ， 然 后 讲授 
后 3 章 之 一 作为 点 睛 之 笔 。 


最 后 的 话 : 我 们 乐于 听取 你 的 意见 


我 们 鼓励 学 生 和 教师 向 我 们 发 送 电子 邮件 ， 发 表 对 本 书 的 任何 评论 。 对 我 们 而 言 ， 
能 够 听 到 来 自 全 世界 的 教师 和 学 生 就 本 书 前 6 版 的 反馈 ， 是 件 令 人 愉快 的 事 。 我 们 已 经 
在 本 书 新 版 中 综合 进 许多 条 建议 。 我 们 也 鼓励 教师 向 我 们 发 送 新 的 课 后 习题 ( 及 其 解 
答 ) ， 这 将 完善 当前 的 课 后 习题 。 我 们 将 这 些 习 题 放 在 配套 Web 网 站 上 只 有 教师 才能 访 
问 的 区 域 。 我 们 也 鼓励 教师 和 学 生 编 写 新 的 Java 小 程序 来 诠释 书 中 的 概念 和 协议 。 如 果 
你 有 了 认为 适合 于 本 书 的 小 程序 ， 请 将 它 发 送 给 作者 。 如 果 该 小 程序 (包括 标记 和 术 
if) 合适 的 话 ， 我 们 很 乐意 将 它 放 在 本 书 的 网 站 上 ， 并 附 上 对 该 小 程序 作者 的 适当 
推荐 。 

正如 谚语 所 说 :“ 让 那些 卡片 和 信件 到 来 吧 !” 我 们 郑重 宣布 ， 请 大 家 一 如 既往 地 告诉 
我 们 有 趣 的 URL， 指 出 排版 错误 ,说 出 不 赞成 我 们 的 哪些 主张 ， 告 诉 我 们 怎样 做 效果 好 、 
怎样 做 效果 不 好 ， 以 及 你 认为 在 本 书 下 一 版 中 应 当 包 括 哪些 内 容 、 删 除 哪 些 内 容 。 我 们 的 
电子 邮件 地 址 是 kurose@ cs. umass. edu 和 ross@ poly. edu。 


O 关于 本 书 教 辅 资源 ， 只 有 使 用 本 书 作 为 教材 的 教师 才 可 以 申请 ， 需 要 的 教师 请 联系 机 械 工 业 出 版 社 华章 公 
司 ， 电话 136 0115 6823, ， 邮 箱 wangguang@ hzbook. com. 一 一 编辑 注 
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Computer Networking: A Top-Down Approach, Seventh Edition 


计算 机 网 络 和 因特网 





今天 的 因特网 无 疑 是 有 史 以 来 由 人 类 创造 、 精 心 设计 的 最 大 系统 ， 该 系统 具有 数 以 亿 
计 的 相连 的 计算 机 、 通 信 链 路 和 交换 机 ， 有 数 十 亿 的 用 便携 计算 机 、 平 板 电脑 和 智能 手机 
连接 的 用 户 ， 并 且 还 有 一 批 与 因特网 连接 的 “物品 ”， 包 括 游 戏 机 、 监 视 系 统 、 手 表 、 有 眼 
镜 、 温 度 调节 装置 、 体 重 计 和 汽车 。 面 对 如 此 巨大 并 且 具 有 如 此 众多 不 同 组 件 和 用 户 的 因 
特 网 ， 是 否 能 够 理解 它 的 工作 原理 ? 是 否 存在 某 些 指导 原则 和 结构 ， 能 够 作为 理解 这 种 规 
模 和 复杂 程度 惊人 的 系统 的 基础 ? 这 样 的 话 ， 能 让 学 习 计 算 机 网 络 成 为 既 引 人 入 胜 又 趣味 
虽然 的 事 吗 ? 幸运 的 是 ， 对 所 有 这 些 问题 都 是 响亮 的 肯定 答复 。 本 书 的 目的 的 确 是 向 读者 
介绍 计算 机 网 络 这 个 动态 领域 的 最 新 知识 ， 使 他 们 深入 地 理解 网 络 的 原则 和 实践 ， 使 读者 
不 仅 能 理解 今天 的 网 络 ， 而 且 能 理解 明天 的 网 络 。 

第 1 章 概述 了 计算 机 网 络 和 因特网 。 这 一 章 的 目标 是 从 整体 上 粗 线条 地 勾勒 出 计算 机 
网 络 的 概貌 ， 并 且 描 述 本 书 内 容 的 框架 。 这 一 章 包 括 大 量 的 背景 知识 ， 讨 论 大 量 的 计算 机 
网 络 构件 ， 而 且 将 它们 放 在 整个 网 络 的 大 环境 中 进行 讨论 。 

本 章 将 以 如 下 方式 组 织 计算 机 网 络 的 概述 : 在 介绍 了 某 些 基本 术语 和 概念 后 ， 将 首先 
查看 构成 网 络 的 基本 硬件 和 软件 组 件 。 我 们 从 网 络 的 边缘 开始 ， 考 察 在 网 络 中 运行 的 端 系 
统 和 网 络 应 用 ; 接 下 来 探究 计算 机 网 络 的 核心 ， 查 看 传输 数据 的 链 路 和 交换 机 ， 以 及 将 端 
系统 与 网 络 核心 相连 接 的 接 人 网 和 物理 媒体 。 我 们 将 了 解 因特网 是 “网 络 的 网 络 ”， 并 将 
得 知 这 些 网 络 是 怎样 彼此 连接 起 来 的 。 

在 浏览 完 计 算 机 网 络 的 边缘 和 核心 之 后 ， 本 章 的 后 半 部 分 将 从 更 广泛 、 更 抽象 的 角度 来 
考察 计算 机 网 络 。 我 们 将 考察 在 计算 机 网 络 中 数据 的 时 延 、 丢 包 和 吞吐 量 ， 给 出 一 个 端 到 端 
吞吐 量 和 时 延 的 简单 定量 模型 该 模型 兼顾 了 传输 、 传 播 和 排队 时 延 等 因素 。 接 下 来 ,我们 
将 介绍 计算 机 联网 时 的 一 些 关 键 的 体系 结构 原则 ， 如 协议 分 层 和 服务 模型 。 我 们 还 将 了 解 到 
计算 机 网 络 对 于 许多 不 同类 型 的 攻击 来 说 是 脆弱 的 ， 将 回顾 其 中 的 某 些 攻 击 并 且 考 虑 使 计算 
机 网 络 更 为 安全 的 方法 。 最 后 ， 我 们 将 以 计算 机 网 络 的 简要 历史 结束 本 章 的 学 习 。 


1.1 ”什么 是 因特网 


在 本 书 中 ， 我 们 使 用 一 种 特定 的 计算 机 网 络 ， 即 公共 因特网 ， 作 为 讨论 计算 机 网 络 及 
其 协议 的 主要 载体 。 但 什么 是 因特网 ? 回答 这 个 问题 有 两 种 方式 : 其 一 ， 我 们 能 够 描述 因 
特 网 的 具体 构成 ， 即 构成 因特网 的 基本 硬件 和 软件 组 件 ; 其 二 ， 我 们 能 够 根据 为 分 布 式 应 
用 提供 服务 的 联网 基础 设施 来 描述 因特网 。 我 们 先 从 描述 因特网 的 具体 构成 开始 ， 并 用 
图 1-1 举例 说 明 我 们 的 讨论 。 


1.1.1 具体 构成 描述 


因特网 是 一 个 世界 范围 的 计算 机 网 络 ， 即 它 是 一 个 互联 了 遍及 全 世界 数 十 亿 计 算 设备 
的 网 络 。 在 不 久 前 ， 这 些 计算 设备 多 数 是 传统 的 桌面 PC. Linux 工作 站 以 及 所 谓 的 服务 器 
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(它们 用 于 存储 和 传输 Web 页 面 和 电子 邮件 报 文 等 信息 ) 。 然 而 ， 越 来 越 多 的 非 传统 的 因 
特 网 “物品 ”( 如 便携 机 、 智 能 手机 、 平 板 电 脑 、 电 视 、 游 戏 机 、 温 度 调节 装置 、 家 用 安 
全 系统 、 家 用 电器 、 和 手表、 眼镜、 汽车、 运输 控制 系统 等 ) 正在 与 因特网 相连 。 的 确 ， 在 
许多 非 传统 设备 连接 到 因特网 的 情况 下 ， 计 算 机 网 络 (computer network) 这 个 术语 开始 听 
起 来 有 些 过 时 了 。 用 因特网 术语 来 说 ， 所 有 这 些 设备 都 称 为 主机 (host) 或 端 系统 (end 
system) 。 据 估计 ， 到 2015 FAKA 50 亿 台 设备 与 因特网 连接 ， 而 到 2020 年 该 数字 将 达 
250 亿 [Gartner 2014]。2015 年 ， 全 世界 已 有 超过 32 亿 因 特 网 用 户 ， 接 近世 界 人 口 的 
40% [ITU 2015], 
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图 1-1 因特网 的 一 些 部 件 
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端 系 统 通过 通信 和 链 路 (communication link) 和 分 组 交换 机 (packet switch) 连接 到 一 
起 。 在 1.2 节 中 ,我 们 将 介绍 许多 类 型 的 通信 和 链 路 ， 它 们 由 不 同类 型 的 物理 媒体 组 成 。 这 
些 物理 媒体 包括 同 轴 电 缆 、 铜 线 、 光 纤 和 无 线 电 频谱 。 不 同 的 链 路 能 够 以 不 同 的 速率 传输 
数据 ， 链 路 的 传输 速率 (transmission rate) 以 比特 / 秒 (bit/s, 或 bps) 度量 。 当 一 台 端 系 
统 要 向 另 一 台 端 系统 发 送 数据 时 ， 发 送 端 系统 将 数据 分 段 ， 并 为 每 段 加 上 首部 字 节 。 由 此 
形成 的 信息 包 用 计算 机 网 络 的 术语 来 说 称 为 分 组 (packet) 。 这 些 分 组 通过 网 络 发 送 到 目 
的 端 系统 ， 在 那里 被 装配 成 初始 数据 。 

分 组 交换 机 从 它 的 一 条 入 通信 链 路 接收 到 达 的 分 组 ， 并 从 它 的 一 条 出 通信 链 路 转发 该 
分 组 。 市 面 上 流行 着 各 种 类 型 、 各 具 特 色 的 分 组 交换 机 ， 但 在 当今 的 因特网 中 ， 两 种 最 著 
名 的 类 型 是 路 由 器 (router) 和 链 路 层 交 换 机 (link-layer switch)。 这 两 种 类 型 的 交换 机 朝 
着 最 终 目 的 地 转发 分 组 。 链 路 层 交 换 机 通常 用 于 接 人 网 中 ， 而 路 由 器 通常 用 于 网 络 核心 
中 。 从 发 送 端 系统 到 接收 端 系统 ， 一 个 分 组 所 经 历 的 一 系列 通信 链 路 和 分 组 交换 机 称 为 通 
过 该 网 络 的 路 径 (route 或 path)。 思 科 公 司 估计 到 2016 年 年 底 全 球 年 度 P 流量 将 超过 泽 
FAT (zettabyte，102 字 节 ) ， 到 2019 年 将 达 每 年 2 泽 字 节 [Cisco VNI 2015] 。 

用 于 传送 分 组 的 分 组 交换 网 络 在 许多 方面 类 似 于 承载 运输 车 辆 的 运输 网 络 ， 该 网 络 包 
括 了 高 速 公 路 、 公 路 和 交叉 口 。 例 如 ， 考 虑 下 列 情况 ， 一 个 工厂 需要 将 大 量 货物 搬运 到 数 
千 公 里 以 外 的 某 个 目的 地 仓库 。 在 工厂 中 ,货物 要 分 开 并 装 上 卡车 车 队 s 然后 ， 每 辆 卡车 
独立 地 通过 高 速 公路 、 公 路 和 立交 桥 组 成 的 网 络 向 仓库 运送 货物 。 在 目的 地 仓库 ， 外 下 这 
些 货物 ， 并 且 与 一 起 装载 的 同一 批 货 物 的 其 余部 分 堆放 在 一 起 。 因 此 ， 在 许多 方面 ， 分 组 
类 似 于 卡车 ， 通 信和 链 路 类 似 于 高 速 公路 和 公路 ， 分 组 交换 机 类 似 于 交叉 口 ， 而 端 系统 类 似 
于 建筑 物 。 就 像 卡 车 选取 运输 网 络 的 一 条 路 径 前 行 一 样 ， 分 组 则 选取 计算 机 网 络 的 一 条 路 
径 前 行 。 

端 系 统 通过 因特网 服务 提供 商 (Internet Service Provider, ISP) 接 入 因特网， 包括 如 
”本 地 电缆 或 电话 公司 那样 的 住宅 区 ISP、 公 司 ISP、 大 学 ISP， 在 机 场 、 旅 馆 、 咖 啡 店 和 其 
他 公共 场所 提供 WiFi 接 入 的 ISP， 以 及 为 智能 手机 和 其 他 设备 提供 移动 接 入 的 蜂窝 数据 
ISP。 每 个 IS 自身 就 是 一 个 由 多 台 分 组 交换 机 和 多 段 通信 和 链 路 组 成 的 网 络 。 各 ISP 为 端 系 
统 提供 了 各 种 不 同类 型 的 网 络 接 入 ， 包 括 如 线 缆 调制 解 调 器 或 DSL 那样 的 住宅 宽带 接 入 、 
高 速 局 域 网 接 人 和 移动 无 线 接 人 。ISP 也 为 内 容 提供 者 提供 因特网 接 人 服务 ， 将 Web 站 点 
和 视频 服务 器 直接 连 和 因特网。 因特网 就 是 将 端 系统 彼此 互联 ， 因 此 为 端 系统 提供 接 人 的 
ISP 也 必须 互联 。 较 低层 的 ISP 通过 国家 的 、 国 际 的 较 高 层 ISP (如 Level 3 Communica- 
tions, AT&T, Sprint 和 NTT) 互联 起 来 。 较 高 层 ISP 是 由 通过 高 速 光纤 链 路 互联 的 高 速 路 
由 器 组 成 的 。 无 论 是 较 高 层 还 是 较 低 层 ISP 网 络 ， 它 们 每 个 都 是 独立 管理 的 ， 运 行 着 全 协 
议 ( 详 情 见 后 ) ， 遵 从 一 定 的 命名 和 地 址 规则 。 我 们 将 在 1.3 节 中 更 为 详细 地 考察 ISP 及 
其 互联 的 情况 。 

端 系 统 、 分 组 交换 机 和 其 他 因特网 部 件 都 要 运行 一 系列 协议 (protocol) ， 这 些 协议 控 
制 因 特 网 中 信息 的 接收 和 发 送 。TCP (Transmission Control Protocol， 传 输 控制 协议 ) Al IP 
(Internet Protocol ， 网 际 协议 ) 是 因特网 中 两 个 最 为 重要 的 协议 。IP 协议 定义 了 在 路 由 器 
和 端 系 统 之 间 发 送 和 接收 的 分 组 格式 。 因 特 网 的 主要 协议 统称 为 TCP/IP。 我 们 在 这 一 章 
中 就 开始 接触 这 些 协 议 。 但 这 仅仅 是 个 开始 ， 本 书 的 许多 地 方 与 计算 机 网 络 协议 有 关 。 

鉴于 因特网 协议 的 重要 性 ， 每 个 人 就 各 个 协议 及 其 作用 取得 一 致 认识 是 很 重要 的 ， 这 
样 人 们 就 能 够 创造 协同 工作 的 系统 和 产品 。 这 正 是 标准 发 挥 作用 的 地 方 。 因 特 网 标准 
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(Internet standard) 由 因特网 工程 任务 组 (Internet Engineering Task Force, IETF) [IETF 
2016] 研发 。 正 TF 的 标准 文档 称 为 请 求 评 论 (Request For Comment, RFC), RFC 最 初 只 
是 普通 的 请 求 评 论 (因此 而 得 名 )， 目 的 是 解决 因特网 先驱 者 们 面临 的 网 络 和 协议 问题 
[ Allman 2011], RFC 文档 往往 是 技术 性 很 强 并 相当 详细 的 。 它 们 定义 了 TCP、IP、HTTP 
(用 于 Web) 和 SMTP (用 于 电子 邮件 ) 等 协议 。 目 前 已 经 有 将 近 7000 个 RFC。 其 他 组 织 
也 在 制定 用 于 网 络 组 件 的 标准 ， 最 引 人 注 目的 是 针对 网 络 链 路 的 标准 。 例 如 ，IEEE 802 
LAN/MAN 标准 化 委员 会 [IEEE 802 2016) 制定 了 以 太 网 和 无 线 WiFi 的 标准 。 


1.1.2 服务 描述 


前 面 的 讨论 已 经 辨识 了 构成 因特网 的 许多 部 件 。 但 是 我 们 也 能 从 一 个 完全 不 同 的 角 
度 ， 即 从 为 应 用 程序 提供 服务 的 基础 设施 的 角度 来 描述 因特网 。 除 了 诸如 电子 邮件 和 
Web 冲浪 等 传统 应 用 外 ， 因 特 网 应 用 还 包括 移动 智能 手机 和 平板 电脑 应 用 程序 ， 其 中 包 
括 即时 讯息 、 与 实时 道路 流量 信息 的 映射 、 来 自 云 的 音乐 流 、 电 影 和 电视 流 、 在 线 社交 
网 络 、 视 频 会 议 、 多 人 游戏 以 及 基于 位 置 的 推荐 系统 。 因 为 这 些 应 用 程序 涉及 多 个 相互 
交换 数据 的 端 系 统 ， 故 它们 被 称 为 分 布 式 应 用 程序 (distributed application ) 。 重 要 的 是 ， 
因特网 应 用 程序 运行 在 端 系 统 上 ， 即 它们 并 不 运行 在 网 络 核心 中 的 分 组 交换 机 中 。 尽 管 - 
分 组 交换 机 能 够 加 速 端 系统 之 间 的 数据 交换 ， 但 它们 并 不 在 意 作 为 数据 的 源 或 宿 的 应 用 
程序 。 

我 们 稍 深入 地 探讨 一 下 为 应 用 程序 提供 服务 的 基础 设施 的 含义 。 为 此 ， 假定 你 对 某 种 
分 布 式 因特网 应 用 有 一 个 激动 人 心 的 新 想法 ， 它 可 能 大 大 地 造福 于 人 类 ， 或 者 它 可 能 直接 
使 你 名 利 双 收 。 你 将 如 何 把 这 种 想法 转换 成 一 种 实际 的 因特网 应 用 呢 ? 因为 应 用 程序 运行 
在 端 系统 上 ， 所 以 你 需要 编写 运行 在 端 系统 上 的 一 些 软件 。 例 如 ， 你 可 能 用 Java, C 或 
Python 编写 软件 。 此 时 ， 因 为 你 在 研发 一 种 分 布 式 因特网 应 用 程序 ， 和 运行 在 不 同 端 系统 上 
的 软件 将 需要 互相 发 送 数据 。 此 时 我 们 碰 到 一 个 核心 问题 ， 这 个 问题 导致 了 另 一 种 描述 因 
特 网 的 方法 ， 即 将 因特网 描述 为 应 用 程序 的 平台 。 运 行 在 一 个 端 系统 上 的 应 用 程序 怎样 才 
能 指令 因特网 向 运行 在 另 一 个 端 系统 上 的 软件 发 送 数据 呢 ? 

与 因特网 相连 的 端 系统 提供 了 一 个 套 接 字 接口 (socket interface) ， 该 接口 规定 了 运行 
在 一 个 端 系统 上 的 程序 请 求 因 特 网 基础 设施 向 运行 在 另 一 个 端 系统 上 的 特定 目的 地 程序 交 
付 数据 的 方式 。 因 特 网 套 接 字 接口 是 一 套 发 送 程序 必须 遵循 的 规则 集合 ， 因 此 因特网 能 够 
将 数据 交付 给 目的 地 。 我 们 将 在 第 2 章 详细 讨论 因特网 套 接 字 接 口 。 此 时 ， 我 们 做 一 个 简 
单 的 类 比 ， 在 本 书 中 我 们 将 经 常 使 用 这 个 类 比 。 假 定 Alice 使 用 邮政 服务 向 Bob 发 一 封 信 。 
当然 ，Alice 不 能 只 是 写 了 这 封 信 (相关 数据 ) 然后 把 该 信 丢 出 窗外 。 相 反 ， 邮 政 服务 要 
求 Alice 将 信 放 人 一 个 信封 中 ; 在 信封 的 中 间 写 上 Bob 的 全 名 、 地 址 和 邮政 编码 ; 封 上 信 
封 ; 在 信封 的 右上 角 贴 上 邮票 ;最 后 将 该 信封 丢 进 一 个 邮局 的 邮政 服务 信箱 中 。 因 此 ， 该 
邮政 服务 有 自己 的 “邮政 服务 接口 ”或 一 套 规则 ， 这 是 Alice 必须 遵循 的 ， 这 样 邮政 服务 
才能 将 她 的 信件 交付 给 Bob。 同 理 ， 因 特 网 也 有 一 个 发 送 数据 的 程序 必须 遵循 的 套 接 字 接 
口 ， 使 因特网 向 接收 数据 的 程序 交付 数据 。 

当然 ， 邮 政 服务 向 顾客 提供 了 多 种 服务 ， 如 特快 专递 、 挂 号 、 普 通 服务 等 。 同 样 ， 因 
特 网 向 应 用 程序 提供 了 多 种 服务 。 当 你 研发 一 种 因特网 应 用 程序 时 ， 也 必须 为 你 的 应 用 程 
序 选择 其 中 的 一 种 因特网 服务 。 我 们 将 在 第 2 章 中 描述 因特网 服务 。 

我 们 已 经 给 出 了 因特网 的 两 种 描述 方法 : 一 种 是 根据 它 的 硬件 和 软件 组 件 来 描述 ， 另 
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一 种 是 根据 基础 设施 向 分 布 式 应 用 程序 提供 的 服务 来 描述 。 但 是 ， 你 也 许 还 是 对 什么 是 因 
特 网 感到 困惑 。 什 么 是 分 组 交换 和 TCP/IP? 什么 是 路 由 器 ? 因特网 中 正在 使 用 什么 样 的 
通信 链 路 ? 什么 是 分 布 式 应 用 ? 一 个 恒温 调节 器 或 人 体 秤 如 何 与 因特网 相连 ? 如 果 你 现在 
还 对 这 些 心 存疑 惑 ， 请 不 要 担心 。 这 本 书 除了 向 你 介绍 因特网 的 具体 构成 外 ， 还 要 介绍 支 
配 因特网 的 工作 原理 以 及 它 工 作 的 来 龙 去 脉 。 我 们 将 在 后 续 章 节 中 解释 这 些 重 要 的 术语 和 
问题 。 


1.1.3 什么 是 协议 


既然 我 们 已 经 对 因特网 是 什么 有 了 一 点 印象 ， 那么 下 面 考虑 计算 机 网 络 中 另 一 个 重要 
AIRE ART: 协议 (protocol)。 什 么 是 协议 ? 协议 是 用 来 干什么 的 ? 

1. 人 类 活动 的 类 比 

也 许 理解 计算 机 网 络 协议 这 一 概念 的 一 个 最 容易 办 法 是 ， 先 与 某 些 人 类 活动 进行 类 
比 ， 因 为 我 们 人 类 无 时 无 刻 不 在 执行 协议 。 考 虑 当 你 想 要 向 某 人 询问 时 间 时 将 要 怎样 做 。 
图 1-2 中 显示 了 一 种 典型 的 交互 过 程 。 人 类 协议 (至少 说 是 好 的 行为 方式 ) 要 求 一 方 首先 
进行 问候 (图 1-2 中 的 第 一 个 “你 好 ”) ， 以 开始 与 男 一 个 人 的 通信 。 对 “你 好 ”的 典型 
响应 是 返回 一 个 “你 好 ” 报 文 。 此 人 用 一 个 热情 的 “你 好 ”进行 响应 ， 隐 含 着 一 种 指示 ， 
表明 能 够 继续 向 那 人 询问 时 间 了。 对 最 初 的 “你 好 ”的 不 同 响应 (例如 “不 要 烦 我 1”， 
或 “我 不 会 说 英语 ”， 或 某 些 不 合 时 宜 的 回答 ) 也 许 表 明了 一 个 勉强 的 或 不 能 进行 的 通 
信 。 在 此 情况 下 ， 按 照 人 类 协议 ， 发 话 者 就 不 能 询问 时 间 了 。 有 时 ， 问 的 问题 根本 得 不 到 
任何 回答 ， 在 此 情况 下 ， 发 话 者 通常 会 放弃 向 这 个 人 询问 时 间 。 注 意 在 我 们 人 类 协议 中 ， 
有 我 们 发 送 的 特定 报 文 ， 也 有 我 们 根据 接收 到 的 应 答 报 文 或 其 他 事件 (例如 在 菜 个 给 定 的 
时 间 内 没有 回答 ) ARMA, BR, 发送 和 接收 的 报 文 ， 以 及 这 些 报 文 发 送 和 接收 或 其 
他 事件 出 现时 所 采取 的 动作 ， 这 些 在 一 个 人 类 协议 中 起 到 了 核心 作用 。 east A 





$ $ ; 
时 间 时 间 时 间 时 间 
图 1-2 人 类 协议 和 计算 机 网 络 协议 
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ATE (Han, WOR—TPADHL, TA—AAUELA, RK—-TAM ABER, Ti 
一 人 却 不 理解 ) ， 这 些 协 议 就 不 能 交互 ， 因 而 不 能 完成 有 用 的 工作 。 在 网 络 中 这 个 道理 同 
样 成 立 。 即 为 了 完成 一 项 工作 ， 要 求 两 个 (或 多 个 ) 通信 实体 运行 相同 的 协议 。 

我 们 再 考虑 第 二 个 人 类 类 比 的 例子 。 假 定 你 正在 大 学 课堂 里 上 课 (例如 上 的 是 计算 
机 网 络 课程 )。 教 师 正 在 啼 虹 九 四 地 讲述 协议 ,而 你 困惑 不 解 。 这 名 教师 停 下 来 问 : 
“同学 们 有 什么 问题 吗 ?” (教师 发 送出 一 个 报 文 ， 该 报 文 被 所 有 没有 睡觉 的 学 生 接收 到 
To) 你 举 起 了 手 (向 教师 发 送 了 一 个 隐 含 的 报 文 )。 这 位 教师 面 带 微笑 地 示意 你 说 : 
“请 讲 ……” (教师 发 出 的 这 个 报 文 鼓励 你 提出 问题 ， 教 师 喜 欢 被 问 问 题 。) 接着 你 就 问 
了 问题 ( 向 该 教师 传输 了 你 的 报 文 )。 教 师 听 取 了 你 的 问题 (接收 了 你 的 问题 报 文 ) 并 
加 以 回答 (向 你 传输 了 回答 报 文 )。 我 们 再 一 次 看 到 了 报 文 的 发 送 和 接收 ， 以 及 这 些 报 
文 发 送 和 接收 时 所 采取 的 一 系列 约定 俗 成 的 动作 ， 这 些 是 这 个 “ 提 间 与 回答 ”协议 的 
关键 所 在 。 

2. 网 络 协 议 

网 络 协 议 类 似 于 人 类 协议 ， 除 了 交换 报 文 和 采取 动作 的 实体 是 某 些 设备 (可 以 是 计算 
机 、 智 能 手机 、 平 板 电脑 、 路 由 器 或 其 他 具有 网 络 能 力 的 设备 ) 的 硬件 或 软件 组 件 。 在 因 
特 网 中 ,涉及 两 个 或 多 个 远程 通信 实体 的 所 有 活动 都 受 协议 的 制约 。 例 如 ， 在 两 台 物 理 上 
连接 的 计算 机 中 ， 硬 件 实现 的 协议 控制 了 在 两 块 网 络 接口 卡 间 的 “ 线 上 ”的 比特 流 ; 在 端 
系统 中 ， 拥 塞 控制 协议 控制 了 在 发 送 方 和 接收 方 之 间 传 输 的 分 组 发 送 的 速率 ; 路 由 器 中 的 
协议 决定 了 分 组 从 源 到 目的 地 的 路 径 。 在 因特网 中 协议 运行 无 处 不 在 ， 因 此 本 书 的 大 量 篇 
幅 都 与 计算 机 网 络 协议 有 关 。 

以 大 家 可 能 熟悉 的 一 个 计算 机 网 络 协议 为 例 ， 考 虑 当 你 向 一 个 Web 服务 器 发 出 请 求 
( 即 你 在 Web 浏览 器 中 键入 一 个 Web 网 页 的 URL) 时 所 发 生 的 情况 。 图 1-2 右 半 部 分 显示 
了 这 种 情形 。 首 先 ， 你 的 计算 机 将 向 该 Web 服务 器 发 送 一 条 连接 请 求 报 文 ， 并 等 待 回答 。 
该 Web 服务 器 将 最 终 能 接收 到 连接 请 求 报 文 ， 并 返回 一 条 连接 响应 报 文 。 得 知 请 求 该 
Web 文档 正常 以 后 ， 计 算 机 则 在 一 条 GET 报 文中 发 送 要 从 这 人 台 Web 服务 器 上 取 回 的 网 页 
名 字 。 最 后 ，Web 服务 器 向 计算 机 返回 该 Web 网 页 (文件 ) 。 

从 上 述 的 人 类 活动 和 网 络 例子 中 可 见 ， 报 文 的 交换 以 及 发 送 和 接收 这 些 报 文 时 所 采取 
的 动作 是 定义 一 个 协议 的 关键 元 素 : 

协议 (protocol) 定义 了 在 两 个 或 多 个 通信 实体 之 间 交 换 的 报 文 的 格式 和 顺 

序 ， 以 及 报 文 发送 和 /或 接收 一 条 报 文 或 其 他 事件 所 采取 的 动作 。 

因特网 〈 更 一 般 地 说 是 计算 机 网 络 ) 广泛 地 使 用 了 协议 。 不 同 的 协议 用 于 完成 不 同 的 
通信 任务 。 当 你 阅读 完 这 本 书后 将 会 知道 ， 某 些 协 议 简单 而 直截了当 ， 而 某 些 协议 则 复杂 
且 隐 涩 难 懂 。 掌 握 计 算 机 网 络 领域 知识 的 过 程 就 是 理解 网 络 协议 的 构成 、 原 理 和 工作 方式 
的 过 程 。 


1.2 网 络 边缘 


在 上 一 节 中 ,我 们 给 出 了 因特网 和 网 络 协议 的 总 体 概述 。 现 在 我 们 将 更 深入 一 些 来 探 
究 计 算 机 网 络 (特别 是 因特网 ) 的 部 件 。 在 本 节 中 ， 我们 从 网 络 边 缘 开 始 ， 观 察 一 下 我 们 
更 为 熟悉 的 部 件 ， 即 我 们 日 常 使 用 的 计算 机 、 智 能 手机 和 其 他 设备 。 在 接 下 来 的 一 节 中 ， 
我 们 将 从 网 络 边缘 向 网 络 核心 推进 ， 查 看 计算 机 网 络 中 的 交换 和 选 路 。 
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回想 前 一 节 中 计算 机 网 络 的 术语 ， 通 常 把 与 因特网 相连 的 计算 机 和 其 他 设备 称 为 端 系 
统 。 如 图 1-3 所 示 ， 因 为 它们 位 于 因特网 的 边缘 ， 故 而 被 称 为 端 系统 。 因 特 网 的 端 系统 包 
括 了 桌面 计算 机 (例如 ,桌面 PC、Mac 和 Linux 设备 ) 、 服 务 器 (例如 ，Web 和 电子 邮件 
服务 器 ) 和 移动 计算 机 (例如 ,便携 机 、 智 能 手机 和 平板 电脑 )。 此 外 ， 越 来 越 多 的 非 传 
统 物品 正 被 作为 端 系 统 与 因特网 相连 (参见 “历史 事件 ” ) 。 





图 1-3 端 系统 交互 


端 系 统 也 称 为 主机 (host) ， 因 为 它们 容纳 〈 即 运行 ) 应 用 程序 ， 如 Web 浏览 器 程 
序 、Web 服务 器 程序 、 电 子 邮 件 客 户 程序 或 电子 邮件 服务 器 程序 等 。 本 书 通 篇 将 交替 使 
用 主机 和 端 系统 这 两 个 术语 ， 即 主机 = 端 系统 。 主 机 有 时 又 被 进一步 划分 为 两 类 : 客户 
(client) 和 服务 器 (server) 。 客 户 通常 是 桌面 PC、 移动 PC 和 智能 手机 等 ， 而 服务 器 通 
常 是 更 为 强大 的 机 器 ， 用 于 存储 和 发 布 Web 页 面 、 流 视频 、 中 继 电 子 邮件 等 。 今天， 
大 部 分 提供 搜索 结果 、 电 子 邮件 、Web 页 面 和 视频 的 服务 器 都 属于 大 型 数据 中 心 (data 
center) 。 例 如 ， 谷歌 公司 (Google) 拥有 50 ~ 100 个 数据 中 心 ， 其 中 15 个 大 型 数据 中 
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心 每 个 都 有 10 万 台 以 上 的 服务 器 。 


物 联 网 


你 能 够 想象 几乎 每 样 东 西 都 与 因特网 无 线 连 接 的 一 个 世界 吗 ? 能 够 想象 在 这 个 世界 
上 连接 了 大 多 数 人 、 汽 车 、 自 和 行车、 眼镜、 手表、 玩具 、 医 疗 设备 、 家 用 传感器 、 教 
室 、 视 频 监 视 系 统 、 大 气 传 感 器 、 陈 列 架 产品 和 宠物 吗 ? 这 种 物 联 网 (Internet of 
Things, IoT) 事实 上 就 在 不 远 的 某 处 。 

据 估 计 ， 在 2015 年 有 50 亿 件 物品 连接 到 因特网 ， 到 了 2020 年 该 数字 能 够 达到 250 
亿 [Gartner 2014]。 这 些 物 品 包括 我 们 的 智能 手机 ， 它 已 经 跟随 我 们 遍及 我 们 的 家 庭 、 
办 公 室 和 汽车 ， 向 ISP 和 因特网 应 用 程序 报告 我 们 的 地 理 位 置 和 使 用 数据 。 而 除了 智能 | 
手机 ， 各 种 各 样 的 非 传 统 “ 物 品 ” 也 已 经 作为 产品 可 供 使 用 。 例 如 ， 有 因特网 连接 的 可 
穿戴 设备 ， 包 括 手表 (来 自 苹 果 和 许多 其 他 生产 商 ) 和 眼镜 。 因 特 网 连接 的 眼镜 能 够 将 
我 们 看 到 的 每 样 东西 上 载 到 云端 ， 允 许 我 们 与 世界 各 地 的 人 们 实时 共享 我 们 的 视觉 体 
验 。 对 于 智能 家 居 ， 有 因特网 连接 的 物品 ， 包 括 恒温 调节 器 (能 够 通过 智能 手机 远程 控 
制 ) 以 及 人 体 秤 (能够 通过 智能 手机 以 图 形 化 方式 审查 我 们 的 饮食 ) 。 有 因特网 连接 的 
玩具 ， 包 括 识别 和 解释 孩子 讲话 并 适当 地 进行 响应 的 玩偶 。 | 

物 联网 给 用 户 带 来 了 革命 性 的 潜在 好 处 。 但 与 此 同时 ， 也 存在 巨大 的 安全 风险 和 隐 
私 风险 。 例 如 ， 攻 击 者 可 能 能 够 通过 因特网 入 侵 物 联网 设备 或 服务 器 ， 以 收集 来 自 物 联 
网 设备 的 数据 。 例 如 ， 攻 击 者 能 够 劫持 一 个 与 因特网 连接 的 玩偶 并 直接 与 孩子 交谈 ， 或 
者 能 够 入 侵 存 储 个 人 健康 或 活动 信息 的 数据 库 ， 这 些 信息 来 自 可 穿戴 设备 。 这 些 安全 和 
隐私 问题 可 能 会 使 消费 者 渐渐 地 失去 信心 ， 并 可 能 导致 消费 者 的 广泛 接受 程度 下 降 
[ FTC 2015]. 








1.2.1 接 入 网 


考虑 了 位 于 “网 络 边缘 ”的 应 用 程序 和 端 系 统 后 ， 我 们 接 下 来 考虑 接 入 网 ， 这 是 指 将 
端 系统 物理 连接 到 其 边缘 路 由 器 (edge router) 的 网 络 。 边 缘 路 由 器 是 端 系统 到 任何 其 他 
远程 端 系统 的 路 径 上 的 第 一 台 路 由 器 。 图 1-4 用 粗 的 、 带 阴影 的 线 显示 了 几 种 类 型 的 接 入 
链 路 和 使 用 接 入 网 的 几 种 环境 ( 家庭、 公司 和 广 域 移动 无 线 ) 。 

1. 家 庭 接 入 : DSL、 电 缆 、FTTH、 拨 号 和 卫星 

2014 年 ， 在 发 达 国家 中 ， 实 现 因 特 网 接 人 的 家 庭 超过 78% ， 名 列 前 茅 的 韩国 、 荷 兰 、 
芬兰 和 瑞典 实现 因特网 接 人 的 家 庭 则 超过 80% ， 几 乎 所 有 家 庭 都 是 经 过 高 速 宽带 连接 
[ITU 2015] 。 考 虑 到 家 庭 对 网 络 接 和 人 的 强烈 兴趣 ， 我 们 从 家 庭 与 因特网 的 连接 开始 介绍 接 
人 网 概况 。 

今天 ， 宽 带 住宅 接 人 有 两 种 最 流行 的 类 型 : 数字 用 户 线 (Digital Subscriber Line, 
DSL) 和 电缆 。 住 户 通常 从 提供 本 地 电话 接 和 人 的 本 地 电话 公司 处 获得 DSL 因特网 接 入 。 因 
此 ， 当 使 用 DSL 时 ， 用 户 的 本 地 电话 公司 也 是 它 的 ISP, WE 1-5 所 示 ， 每 个 用 户 的 DSL 
调制 解 调 器 使 用 现 有 的 电话 线 ( 即 双 绞 铜 线 ， 将 在 1. 2. 2 节 中 讨论 它 ) 与 位 于 电话 公司 的 
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本 地 中 心 局 (C0) 中 的 数字 用 户 线 接 人 复 用 器 (DSLAM) 交换 数据 。 家 庭 的 DSL 调制 解 
调 器 得 到 数字 数据 后 将 其 转换 为 高 频 音 ， 以 通过 电话 线 传输 给 本 地 中 心 局 ; 来 自 许多 家 庭 
的 模拟 信号 在 DSLAM 处 被 转换 回 数字 形式 。 









一 一 e 


图 1-4 AR 


现 有 电话 线 : 

0~4kHz 为 电话 ; 4~50kHz 
为 上 行 数据 ; 50kHz~1MHz 
为 下 行 数据 


图 1-5 DSL 因特网 接 入 
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家 庭 电 话 线 同时 承载 了 数据 和 传统 的 电话 信号 ， 它 们 用 不 同 的 频率 进行 编码 : 

e 高 速 下 行 信 道 ， 位 于 50kHz 到 1MHz 频段 ; 

。 中 速 上 行 信道 ， 位 于 4kHz 到 50kHz 频段 ; 

e 普通 的 双向 电话 信道 ， 位 于 0 到 4kHz 频段 。 

这 种 方法 使 单 根 DSL 线路 看 起 来 就 像 有 3 根 单独 的 线路 一 样 ， 因 此 一 个 电话 呼叫 和 一 
个 因特网 连接 能 够 同时 共享 DSL 链 路 。 (1. 3. 1 节 将 描述 这 种 频 分 复 用 技术 。) 在 用 户 一 
侧 ， 一 个 分 配器 把 到 达 家 庭 的 数据 信号 和 电话 信号 分 隔 开 ， 并 将 数据 信号 转发 给 DSL 调制 
解 调 器 。 在 电话 公司 一 侧 ， 在 本 地 中 心 局 中 ，DSLAM 把 数据 和 电话 信号 分 隔 开 ， 并 将 数 
据 送 往 因特网 。 数 百 甚 至 上 千 个 家 庭 与 同一 个 DSLAM 相连 [ Dischinger 2007 ] 。 

DSL 标准 定义 了 多 个 传输 速率 ， 包 括 12Mbps 下 行 和 1.8Mbps 上 行 传输 速率 [ITU 
1999 ] ， 以 及 55Mbps 下 行 和 15Mbps 上 行 传输 速率 [ITU 2006 ] 。 因 为 这 些 上 行 速率 和 下 行 
速率 是 不 同 的 ， 所 以 这 种 接 和 人 被 称 为 是 不 对 称 的 。 实 际 取得 的 下 行 和 上 行 传输 速率 也 许 小 
于 上 述 速率 ， 因 为 当 DSL 提供 商 提供 分 等 级 的 服务 ( 以 不 同 的 价格 使 用 不 同 的 速率 ) 时 ， 
他 们 也 许 有 意 地 限制 了 住宅 速率 ,或 者 因为 家 庭 与 本 地 中 心 局 之 间 的 距离 、 双 绞 线 的 规格 
和 电气 干扰 的 程度 而 使 最 大 速率 受 限 。 工 程 师 特别 为 家 庭 与 本 地 中 心 局 之 间 的 短 距离 接 入 
设计 了 DSL; 一 般 而 言 ， 如 果 住 宅 不 是 位 于 本 地 中 心 局 的 5~10 英里 (1 英里 = 1609. 344 
A) 范围 内 ， 该 住宅 必须 采用 其 他 形式 的 因特网 接 人 。 

DSL 利用 电话 公司 现 有 的 本 地 电话 基础 设施 ， 而 电缆 因特网 接 入 (cable Internet access) 
利用 了 有 线 电视 公司 现 有 的 有 线 电视 基础 设施 。 住 宅 从 提供 有 线 电视 的 公司 获得 了 电缆 因 特 
网 接 入 。 如 图 1-6 所 示 ， 光 缆 将 电缆 头 端 连接 到 地 区 槐 纽 ， 从 这 里 使 用 传统 的 同 轴 电 缆 到 达 
各 家 各 户 和 公寓 。 每 个 地 区 枢纽 通常 支持 500 ~ 5000 个 家 庭 。 因 为 在 这 个 系统 中 应 用 了 光纤 
和 同 轴 电 缆 ， 所 以 它 经 常 被 称 为 混合 光纤 同 轴 (Hybrid Fiber Coax, HFC) 系统 。 


数 以 百 计 的 
家 庭 


Dail 


其 机 
|, anu 


数 以 百 计 的 
家 庭 





图 1-6 一 个 混合 光纤 同 轴 接 入 网 


电缆 因特网 接 入 需要 特殊 的 调制 解 调 器 ， 这 种 调制 解 调 器 称 为 电缆 调制 解 调 器 (cable 
modem) 。 如 同 DSL 调制 解 调 器 ， 电 缆 调制 解 调 器 通常 是 一 个 外 部 设备 ， 通 过 一 个 以 太 网 
端口 连接 到 家 庭 PC。( 我 们 将 在 第 6 章 非常 详细 地 讨论 以 太 网 。) 在 电缆 头 端 ， 电 缆 调制 
解 调 器 端 接 系统 (Cable Modem Termination System，CMTS) 与 DSL 网 络 的 DSLAM 具有 类 
似 的 功能 ， 即 将 来 自 许多 下 行家 庭 中 的 电缆 调制 解 调 器 发 送 的 模拟 信号 转换 回 数字 形式 。 
电缆 调制 解 调 器 将 HFC 网 络 划 分 为 下 行 和 上 行 两 个 信道 。 如 同 DSL， 接 入 通常 是 不 对 称 
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的 ， 下 行 信 道 分 配 的 传输 速率 通常 比 上 行 信道 的 高 。D0OCSIS 2.0 标准 定义 了 高 达 
42. 8Mbps 的 下 行 速率 和 高 达 30. 7Mbps 的 上 行 速率 。 如 在 DSL 网 络 中 的 情况 那样 ， 由 于 较 
低 的 合同 数据 率 或 媒体 损耗 ， 可 能 不 一 定 能 达到 最 大 可 取得 的 速率 。 

电缆 因特网 接 人 的 一 个 重要 特征 是 共享 广播 媒体 。 特 别 是 ， 由 头 端 发 送 的 每 个 分 组 向 
下 行经 每 段 链 路 到 每 个 家 庭 ; 每 个 家 庭 发 送 的 每 个 分 组 经 上 行 信道 向 头 端 传输 。 因 此 ， 如 
果 几 个 用 户 同 时 经 下 行 信道 下 载 一 个 视频 文件 ， 每 个 用 户 接收 视频 文件 的 实际 速率 将 大 大 
低 于 电缆 总 计 的 下 行 速率 。 而 另 一 方面 ， 如 果 仅 有 很 少 的 活跃 用 户 在 进行 Web 冲浪 ， 则 
每 个 用 户 都 可 以 以 全 部 的 下 行 速率 接收 Web 网 页 ， 因 为 用 户 们 很 少 在 完全 相同 的 时 刻 请 
求 网 页 。 因 为 上 行 信道 也 是 共享 的 ， 需 要 一 个 分 布 式 多 路 访问 协议 来 协调 传输 和 避免 碰 
撞 。( 我 们 将 在 第 6 章 中 更 为 详细 地 讨论 碰撞 问题 。) 

尽管 DSL 和 电缆 网 络 当 前 代表 了 超过 85% 的 美国 住宅 宽带 接 人 ， 但 一 种 提供 更 高 速 
率 的 新 兴 技 术 是 光纤 到 户 (Fiber To The Home, FTTH) [FTTH Council 2016 ] 。 顾 名 思 义 ， 
FTTH 概念 简单 ， 从 本 地 中 心 局 直接 到 家 庭 提供 了 一 条 光纤 路 径 。 现 在 ， 许 多 国家 或 地 区 ， 
包括 阿拉 伯 联 合 酋长 国 、 韩 国 、 中 国 香港 、 日 本 、 新 加 坡 、 中 国 台湾 、 立 陶 宛 和 瑞典 ， 人 
户 率 已 经 超过 了 30% [ FTTH Council 2016] 。 

从 本 地 中 心 局 到 家 庭 有 几 种 有 竞争 性 的 光纤 分 布 方案 。 最 简单 的 光纤 分 布 网 络 称 为 直 
接 光 纤 ， 从 本 地 中 心 局 到 每 户 设置 一 根 光纤 。 更 为 一 般 的 是 ， 从 中 心 局 出 来 的 每 根 光纤 实 
际 上 由 许多 家 庭 共 享 ， 直 到 相对 接近 这 些 家 庭 的 位 置 ， 该 光纤 才 分 成 每 户 一 根 光纤 。 进 行 
这 种 分 配 有 两 种 有 竞争 性 的 光纤 分 布 体系 结构 : 主动 光纤 网 络 (Active Optical Network, 
AON) 和 被 动 光纤 网 络 (Passive Optical Network, PON), AON 本 质 上 就 是 交换 因特网 ， 
我 们 将 在 第 6 章 讨论 它 。 

这 里 ， 我 们 简要 讨论 一 下 PON ， 该 技术 用 于 Verizon 的 FIOS 服务 中 。 图 1-7 显示 了 使 
FA PON 分 布 体系 结构 的 FTTH。 每 个 家 庭 具有 一 个 光纤 网 络 端 接 器 (Optical Network Termi- 
nator，ONT) ， 它 由 专门 的 光纤 连接 到 邻近 的 分 配器 (splitter) 。 该 分 配器 把 一 些 家 庭 ( 通 
常 少 于 100 个 ) 集结 到 一 根 共享 的 光纤 ， 该 光纤 再 连接 到 本 地 电话 和 公司 的 中 心 局 中 的 光 
纤 线路 端 接 器 (Optical Line Terminator，OLT) 。 该 OLT 提供 了 光 信号 和 电信 号 之 间 的 转 
换 ， 经 过 本 地 电话 公司 路 由 器 与 因特网 相连 。 在 家 庭 中 ， 用 户 将 一 台 家 庭 路 由 器 (通常 是 
无 线路 由 器 ) 与 ONT 相连 ， 并 经 过 这 人 台 家 庭 路 由 器 接 人 因特网 。 在 PON 体系 结构 中 ， 所 
有 从 OLT 发 送 到 分 配器 的 分 组 在 分 配器 〈 类 似 于 一 个 电缆 头 端 ) 处 复制 。 





图 1-7 FITH 因特网 接 人 
FTTH 有 潜力 提供 每 秒 千 兆 比特 范围 的 因特网 接 人 速率 。 然 而 ， 大 多 数 FTTH ISP 提供 
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多 种 不 同 速率 选择 ， 较 高 的 速率 自然 花费 更 多 。 美 国 FTTH 用 户 在 2011 年 的 平均 下 行 速率 
大 约 为 20Mbps (与 13Mbps 电缆 接 和 人 网 相当 ， 而 小 于 5Mbps DSL) [FTTH Council 2011b] 。 

还 可 采用 另外 两 种 接 人 网 技术 为 家 庭 提 供 因 特 网 接 人 。 在 无 法 提供 DSL、 电 缆 和 
FTTH 的 地 方 〈 例 如 在 某 些 乡村 环境 ) ， 能 够 使 用 卫星 链 路 将 住宅 以 超过 1Mbps 的 速率 与 
因特网 相连 。StarBand 和 HughesNet 是 两 家 这 样 的 卫星 接 人 提供 商 。 使 用 传统 电话 线 的 拨 
SHAS DSL 基于 相同 的 模式 : 家 庭 的 调制 解 调 器 经 过 电话 线 连 接 到 ISP 的 调制 解 调 器 。 
与 DSL 和 其 他 宽带 接 人 网 相 比 ， 拨 号 接 人 56kbps 的 慢 速 率 是 令 人 痛苦 的 。 

2. 企业 (和 家 庭 ) HA: 以 太 网 和 WiFi 

adapt We ab sige acne OE 使 用 局 域 网 (LAN) 将 端 系统 连接 到 
边缘 路 由 器 。 尽 管 有 许多 不 同类 型 的 
局 域 网 技术 ,但 是 以 太 网 到 目前 为 止 
是 公司 、 大 学 和 家 庭 网 络 中 最 为 流行 
的 接 入 技术 。 如 图 1-8 中 所 示 ， 以 太 
网 用 户 使 用 双 绞 铜 线 与 一 台 以 太 网 交换 
机 相连 ,第 6 章 中 将 详细 讨论 该 技术 。 
以 太 网 交换 机 或 这 样 相连 的 交换 机 网 
络 ， 则 再 与 更 大 的 因特网 相连 。 使 用 以 
太 网 接 入 ， 用 户 通常 以 100Mbps 或 
1Gbps 速率 接 入 以 太 网 交换 机 ， 而 服务 图 1-8 以太 网 因特网 楼 入 
器 可 能 具有 1Cbps 甚至 10Gbps 的 接 人 速率 。 

然而 ， 越 来 越 多 的 人 从 便携 机 、 智 能 手机 、 平 板 电脑 和 其 他 物品 无 线 接 人 因特网 ( 参 
见 前 面 的 插入 内 容 “ 物 联网 ”) 。 在 无 线 LAN 环境 中 ， 无 线 用 户 从 /到 一 个 接 入 点 发 送 / 接 
收 分 组 ， 该 接 入 点 与 企业 网 连接 〈 很 可 能 使 用 了 有 线 以 太 网 ) ， 企 业 网 再 与 有 线 因 特 网 相 
连 。 一 个 无 线 LAN 用 户 通常 必须 位 于 接 人 点 的 几 十 米 范围 内 。 基 于 IEEE 802. 11 技术 的 无 
线 LAN 接 人 ， 更 通俗 地 称 为 WiFi， 目 前 几乎 无 所 不 在 ， 如 大 学 、 商 业 办 公 室 、 咖 啡 厅 、 
机 场 、 家 庭 ， 甚 至 在 飞机 上 。 在 许多 城市 ， 人 们 能 够 站 在 街头 而 位 于 10 或 20 个 基站 范围 
内 〈 对 于 可 浏览 的 802. 11 基站 全 局 图 ， 人 参见 [wigle. net 2016] ， 这 些 基 站 由 那些 非常 热心 
做 这 种 事情 的 人 发 现 并 记载 在 Web 站 点 上 ) 。 如 在 第 7 章 详 细 讨论 的 那样 ，802. 11 SRE 
供 了 高 达 100Mbps 的 共享 传输 速率 。 

虽然 以 太 网 和 WiFi 接 入 网 最 初 是 设置 在 企业 (公司 或 大 学 ) 环境 中 的 ， 但 它们 近来 
已 经 成 为 家 庭 网 络 中 相当 常见 的 部 件 。 今 天 许多 家 庭 将 宽带 住宅 接 人 ( 即 电缆 调制 解 调 器 
BK DSL) 与 廉价 的 无 线 局 域 网 技术 结合 起 来 ， 以 产生 强大 的 家 用 网 络 [Edwards 2011 ] 。 图 
1-9 显示 了 典型 的 家 庭 网 络 。 这 个 家 庭 网 络 组 成 如 下 : 一 台 漫游 的 便携 机 和 一 台 有 线 PC; 一 
个 与 无 线 PC 和 家 中 其 他 无 线 设 备 通信 的 基站 (无 线 接 入 点 ); 一 个 提供 与 因特网 宽带 接 人 的 
电缆 调制 解 调 器 ; 一 台 互 联 了 基站 及 带 有 电缆 调制 解 调 器 的 固定 PC 的 路 由 器 。 该 网 络 允 许 
家 庭 成 员 经 宽带 接 人 因特网 ， 其 中 任何 一 个 家 庭 成 员 都 可 以 在 厨房 、 院 子 或 卧室 漫游 上 网 。 

3. REIZA: 3G 和 LTE 


iPhone 和 安 卓 等 设备 越 来 越 多 地 用 来 在 移动 中 发 信息 、 在 社交 网 络 中 分 享 照片 、 观 看 
视频 和 放 音 乐 。 这 些 设备 应 用 了 与 蜂窝 移动 电话 相同 的 无 线 基础 设施 ， 通 过 蜂窝 网 提供 商 
运营 的 基站 来 发 送 和 接收 分 组 。 与 WiFi 不 同 的 是 ， 一 个 用 户 仅 需要 位 于 基站 的 数 万 米 
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(而 不 是 几 十 米 ) 范围 内 。 






图 1-9 一 个 典型 的 家 庭 网 络 的 示意 图 


电信 公司 已 经 在 所 谓 第 三 代 (3G) 无 线 技术 中 进行 了 大 量 投资 ，3G 为 分 组 交换 广 域 
无 线 因特网 接 人 提供 了 超过 1Mbps 的 速率 。 甚 至 更 高 速率 的 广 域 接 人 技术 即 第 四 代 (4G) 
广 域 无 线 网 络 也 已 经 被 部 署 了 。LTE (KWH “Long-Term Evolution ”的 缩写 ， 被 评 为 
最 差 首 字母 缩写 词 年 度 奖 候选 者 ) 来 源 于 3G 技术 ， 它 能 够 取得 超过 10Mbps 的 速率 。 据 
报道 ， 几 十 Mbps 的 LTE 下 行 速率 已 经 在 商业 部 署 中 得 到 应 用 。 我 们 将 在 第 7 章 讨论 无 线 
网 络 和 移动 性 ， 以 及 WiFi、3G 和 LTE 等 技术 的 基本 原则 。 


1.2.2 物理 媒体 


在 前 面 的 内 容 中 ,我 们 概述 了 因特网 中 某 些 最 为 重要 的 网 络 接 入 技术 。 当 我 们 描述 
这 些 技术 时 ,我 们 也 指出 了 所 使 用 的 物理 媒体 。 例 如 ， 我们 说 过 HPC 使 用 了 光缆 和 同 
轴 电 缆 相 结 合 的 技术 。 我 们 说 过 DSL 和 以 太 网 使 用 了 双 绞 铜 线 。 我 们 也 说 过 移动 接 入 网 
使 用 了 无 线 电 频谱 。 在 这 一 节 中 ， 我们 简要 概述 一 下 这 些 和 其 他 常 在 因特网 中 使 用 的 传 
输 媒体 。 : 
”为 了 定义 物理 媒体 所 表示 的 内 容 ， 我 们 仔细 思考 一 下 一 个 比特 的 短暂 历程 。 考 虑 一 个 
比特 从 一 个 端 系统 开始 传输 ， 通 过 一 系列 链 路 和 路 由 器 ， 到 达 另 一 个 端 系统 。 这 个 比特 被 
漫不经心 地 传输 了 许 许多 多 次 ! 源 端 系 统 首先 发 射 这 个 比特 ,不久 后 其 中 的 第 一 人 台 路 由 器 
接收 该 比特 ; 第 一 台 路 由 器 发 射 该 比特 ， 接 着 不 久 后 第 二 台 路 由 器 接收 该 比特 ; 等 等 。 因 
此 ， 这 个 比特 当 从 源 到 目的 地 传输 时 ， 通 过 一 系列 “发 射 器 -接收 器 ”对 。 对 于 每 个 发 射 
器 -接收 器 对 ， 通 过 跨越 一 种 物理 媒体 (physical medium) 传播 电磁 波 或 光 脉 冲 来 发 送 该 
比特 。 该 物理 媒体 可 具有 多 种 形状 和 形式 ， 并 且 对 沿途 的 每 个 发 射 器 -接收 器 对 而 言 不 必 
具有 相同 的 类 型 。 物 理 媒 体 的 例子 包括 双 绞 铜 线 、 同 轴 电 绕 、 多 模 光 纤 绕 、 陆 地 无 线 电 频 
谱 和 卫星 无 线 电 频谱 。 物 理 媒 体 分 成 两 种 类 型 导 引 型 媒体 (guided media) 和 非 导 引 型 
媒体 unguided media) 。 对 于 导 引 型 媒体 ， 电 波 沿 着 固体 媒体 前 行 ， 如 光缆 、 双 绞 铜 线 或 
同 轴 电 缆 。 对 于 非 导 引 型 媒体 ， 电 波 在 空气 或 外 层 空 间 中 传播 ， 例 如 在 无 线 局 域 网 或 数字 
卫星 频道 中 。 

在 深入 讨论 各 种 媒体 类 型 的 特性 之 前 ,我 们 简要 地 讨论 一 下 它们 的 成 本 。 物 理 链 路 
( 铜 线 、 光 缆 等 ) 的 实际 成 本 与 其 他 网 络 成 本 相 比 通常 是 相当 小 的 。 特 别 是 安装 物理 链 路 
的 劳动 力 成 本 能 够 比 材料 的 成 本 高 出 几 个 数量 级 。 正 因为 这 个 原因 ， 许 多 建筑 商 在 一 个 建 
筑 物 的 每 个 房间 中 安装 了 双 绞 线 、 光 缆 和 同 轴 电缆 。 即 使 最 初 仅 使 用 了 一 种 媒体 ， 在 不 久 
的 将 来 也 可 能 会 使 用 另 一 种 媒体 ， 这 样 将 来 不 必 再 铺设 另外 的 线 缆 ， 从 而 节省 了 经 费 。 








1. 双 绞 钢 线 


最 便宜 并 且 最 常用 的 导 引 型 传输 媒体 是 双 绞 铜 线 。 一 百 多 年 来 ， 它 一 直 用 于 电话 网 。 
事实 上 ， 从 电话 机 到 本 地 电话 交换 机 的 连 线 超过 99% 使 用 的 是 双 绞 铜 线 。 我 们 多 数 人 在 自 
己 家 中 和 工作 环境 中 已 经 看 到 过 双 绞 线 。 双 绞 线 由 两 根 绝 缘 的 铜 线 组 成 ， 每 根 大 约 1mm 
粗 ， 以 规则 的 螺旋 状 排列 着 。 这 两 根 线 被 绞 合 起 来 ， 以 减少 邻近 类 似 的 双 绞 线 的 电气 干 
扰 。 通 常 许多 双 绞 线 捆扎 在 一 起 形成 一 根 电缆 ， 并 在 这 些 双 绞 线 外 面 覆盖 上 保护 性 防护 
层 。 一 对 电线 构成 了 一 个 通信 和 链 路 。 无 屏蔽 双 绞 线 (Unshielded Twisted Pair, UTP) 常用 
在 建筑 物 内 的 计算 机 网 络 中 ， 即 用 于 局 域 网 (LAN) 中 。 目 前 局 域 网 中 的 双 绞 线 的 数据 速 
率 从 10Mbps 到 10Gbps。 所 能 达到 的 数据 传输 速率 取决 于 线 的 粗细 以 及 传输 方 和 接收 方 之 
间 的 距离 。 

20 世纪 80 年 代 出 现 光纤 技术 时 ， 许 多 人 因为 双 绞 线 比特 速率 低 而 轻视 它 ， 某 些 人 甚 
至 认为 光纤 技术 将 完全 代替 双 绞 线 。 但 双 绞 线 不 是 那么 容易 被 抛弃 的 。 现 代 的 双 绞 线 技 术 
例如 6a 类 电缆 能 够 达到 10Gbps 的 数据 传输 速率 ， 距 离 长 达 100m。 双 绞 线 最 终 已 经 作为 
高 速 LAN 联网 的 主导 性 解决 方案 。 

如 前 面 讨论 的 那样 ， 双 绞 线 也 经 常用 于 住宅 因特网 接 入。 我们 看 到 ， 拨 号 调制 解 调 器 技 
术 通 过 双 绞 线 能 以 高 达 56kbps 的 速率 接 入 。 我 们 也 看 到 ， 数 字 用 户 线 (DSL) 技术 通过 双 绞 
线 使 住宅 用 户 以 超过 数 十 Mbps 的 速率 接 入 因特网 ( 当 用 户 靠近 ISP 的 中 心 局 居住 时 ) 。 

2. 同 轴 电 缆 

与 双 绞 线 类 似 ， 同 轴 电 缆 由 两 个 铜 导体 组 成 ， 但 是 这 两 个 导体 是 同心 的 而 不 是 并 行 
的 。 借 助 于 这 种 结构 及 特殊 的 绝缘 体 和 保护 层 ， 同 轴 电 缆 能 够 达到 较 高 的 数据 传输 速 
率 。 同 轴 电 缆 在 电线 电视 系统 中 相当 普遍 。 我 们 前 面 已 经 看 到 ， 电 缆 电 视 系统 最 近 与 电 
缆 调制 解 调 器 结合 起 来 ， 为 住宅 用 户 提 供 数 十 Mbps 速率 的 因特网 接 入 。 在 电缆 电视 和 
电缆 因特网 接 人 中 ， 发 送 设备 将 数字 信和 号 调制 到 某 个 特定 的 频段 ， 产 生 的 模拟 信和 号 从 发 
送 设备 传送 到 一 个 或 多 个 接收 方 。 同 轴 电 缆 能 被 用 作 导 引 型 共享 媒体 (shared medium) 。 
特别 是 ， 许 多 端 系统 能 够 直接 与 该 电缆 相连 ， 每 个 端 系统 都 能 接收 由 其 他 端 系统 发 送 的 
内 容 。 

3. 光纤 

光纤 是 一 种 细 而 柔软 的 、 能 够 导 引 光 脉 冲 的 媒体 ， 每 个 脉冲 表示 一 个 比特 。 一 根 光 
纤 能 够 支持 极 高 的 比特 速率 ， 高 达 数 十 甚至 数 百 Cbps。 它 们 不 受 电磁 干扰 ， 长 达 100km 
的 光缆 信号 衰减 极 低 ， 并 且 很 难 窃听 。 这 些 特征 使 得 光纤 成 为 长 途 导 引 型 传输 媒体 ， 特 
别 是 跨 海 链 路 。 在 美国 和 别 的 地 方 ， 许 多 长 途 电话 网 络 现在 全 面 使 用 光纤 。 光 纤 也 广泛 
用 于 因特网 的 主干 。 然 而 ， 高 成 本 的 光 设 备 ， 如 发 射 器 、 接 收 器 和 交换 机 ， 阻 碍 光纤 在 
短途 传输 中 的 应 用 ， 如 在 LAN 或 家 庭 接 人 网 中 就 不 使 用 它们 。 光 载波 (Optical Carrier, 
OC) 标准 链 路 速率 的 范围 从 51. 8Mbps 到 39. 8Gbps; 这 些 标 准 常 被 称 为 0C-n， 其 中 的 
链 路 速率 等 于 nx51.8Mbps。 目 前 正在 使 用 的 标准 包括 0C-1、0C-3、0C-12、0C-24、 
0C-48、0C-96、0C-192、0C-768。[ Mukherjee 2006; Ramaswami 2010] 提供 了 光纤 网 
络 各 方面 的 知识 。 


4. 陆地 无 线 电信 道 
无 线 电信 道 承载 电磁 频谱 中 的 信号 。 它 不 需要 安装 物理 线路 ， 并 具有 穿 透 墙壁 、 提 供 
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与 移动 用 户 的 连接 以 及 长 距离 承载 信号 的 能 力 ， 因 而 成 为 一 种 有 吸引 力 的 媒体 。 无 线 电 信 
道 的 特性 极 大 地 依赖 于 传播 环境 和 信和 号 传输 的 距离 。 环 境 上 的 考虑 取决 于 路 径 损 耗 和 遮挡 
衰落 ( 即 当 信号 跨 距 离 传 播 和 绕 过 /通过 阻碍 物体 时 信号 强度 降低 )、 多 径 衰 落 (由 于 干 
扰 对 象 的 信号 反射 ) 以 及 干扰 (由 于 其 他 传输 或 电磁 信号 ) 。 

陆地 无 线 电 信道 能 够 大 致 划分 为 三 类 : 一 类 运行 在 很 短 距离 (如 1 米 或 2 米 ); 另 一 
类 运行 在 局 域 ， 通常 跨越 数 十 到 几 百 米 ; 第 三 类 运行 在 广 域 ， 跨 越 数 万 米 。 个 人 设备 如 无 
线头 戴 式 耳机 、 键 盘 和 医疗 设备 跨 短 距离 运行 ; 在 1. 2.1 节 中 描述 的 无 线 LAN 技术 使 用 了 
局 域 无 线 电信 道 ; 蜂窝 接 人 技术 使 用 了 广 域 无 线 电信 道 。 我 们 将 在 第 7 章 中 详细 讨论 无 线 
电信 道 。 

5. 卫星 无 线 电信 道 

一 颗 通信 卫星 连接 地 球 上 的 两 个 或 多 个 微波 发 射 器 /接收 器 ， 它 们 被 称 为 地 面 站 。 该 卫 
星 在 一 个 频段 上 接收 传输 ， 使 用 一 个 转发 器 (下 面 讨论 ) 再 生 信 和 号， 并 在 另 一 个 频率 上 发 射 
信和 号。 通信 中 常 使 用 两 类 卫星 : 同步 卫星 (geostationary satellite) 和 近 地 轨 道 ( Low- Earth 
Orbiting, LEO) 卫星 [ Wiki Satellite 2016], 

同步 卫星 永久 地 停留 在 地 球 上 方 的 相同 点 上 。 这 种 静止 性 是 通过 将 卫星 置 于 地 球 表面 
上 方 36 000km 的 轨道 上 而 取得 的 。 从 地 面 站 到 卫星 再 回 到 地 面 站 的 巨大 距离 引入 了 可 观 
的 280ms 信和 号 传播 时 延 。 不 过 ， 能 以 数 百 Mbps 速率 运行 的 卫星 链 路 通常 用 于 那些 无 法 使 
用 DSL 或 电缆 因特网 接 入 的 区 域 。 

近 地 轨 道 卫 星 放置 得 非常 靠近 地 球 ， 并 且 不 是 永久 地 停留 在 地 球 上 方 的 一 个 点 。 它 们 
围绕 地 球 旋转 ， 就 像 月 亮 围绕 地 球 旋转 那样 ， 并 且 彼 此 之 间 可 进行 通信 ， 也 可 以 与 地 面 站 
通信 。 为 了 提供 对 一 个 区 域 的 连续 覆盖 ， 需 要 在 轨道 上 放置 许多 卫星 。 当 前 有 许多 低 轨道 
通信 系统 在 研制 中 。LEO 卫星 技术 未 来 也 许 能 够 用 于 因特网 接 人 。 


1.3 “网络 核心 


在 考察 了 因特网 边缘 后 ， 我 们 现在 更 深入 地 研究 网 络 核心 ， 即 由 互联 因特网 端 系 统 的 
分 组 交换 机 和 链 路 构成 的 网 状 网 络 。 图 1-10 用 加 粗 阴 影 线 勾画 出 网 络 核心 部 分 。 


1.3.1 分 组 交换 


在 各 种 网 络 应 用 中 ， 端 系统 彼此 交换 报 文 (message) 。 报 文 能 够 包含 协议 设计 者 需 
要 的 任何 东西 。 报 文 可 以 执行 一 种 控制 功能 (例如 ， 图 1-2 所 示例 子 中 的 “你 好 ” 报 
文 )， 也 可 以 包含 数据 ， 例 如 电子 邮件 数据 、JPEG RRE MP3 音频 文件 。 为 了 从 源 端 
系统 向 目的 端 系统 发 送 一 个 报 文 ， 源 将 长 报 文 划分 为 较 小 的 数据 块 ， 称 之 为 分 组 
(packet) 。 在 源 和 目的 地 之 间 ， 每 个 分 组 都 通过 通信 链 路 和 分 组 交换 机 (packet switch) 
传送 。( 交 换 机 主要 有 两 类 : 路 由 器 (router) 和 链 路 层 交 换 机 (link-layer switch) 。) 分 组 
以 等 于 该 链 路 最 大 传输 速率 的 速度 传输 通过 通信 链 路 。 因 此 ， 如 果 某 源 端 系统 或 分 组 交换 
机 经 过 一 条 链 路 发 送 一 个 工 比 特 的 分 组 ， 链 路 的 传输 速率 为 尺 比特 / 秒 ， 则 传输 该 分 组 的 
时 间 为 L/R 秒 。 

1. 存储 转发 传输 


多 数 分 组 交换 机 在 链 路 的 输入 端 使 用 存储 转发 传输 (store- and- forward transmission ) 
机 制 。 存 储 转发 传输 是 指 在 交换 机 能 够 开始 向 输出 链 路 传输 该 分 组 的 第 一 个 比特 之 前 ， 必 
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图 1-10 网 络 核心 
MRE s ST EGR EE, 考虑 由 两 个 端 系统 经 一 台 路 由 器 


连接 构成 的 简单 网 络 ， 如 图 1- 11 所 示 。 

一 台 路 由 器 通常 有 多 条 繁忙 的 链 路 ， 因 
为 它 的 任务 就 是 把 一 个 人 分 组 交换 到 一 
条 出 链 路 。 在 这 个 简单 例子 中 ， 该 路 由 








Rbps 





分 组 1 的 前 面部 分 存储 ”目的 地 


在 路 由 器 中 ， 在 转发 前 
在 图 1-11 所 示 的 特定 时 刻 ， 源 已 经 传输 1-11 存储 转发 分 组 交换 


了 分 组 1 的 一 部 分 ,分 组 1 的 前 沿 已 经 到 达 了 路 由 器 。 因 为 该 路 由 器 应 用 了 存储 转发 机 
制 ， 所 以 此 时 它 还 不 能 传输 已 经 接收 的 比特 ， 而 是 必须 先 缓存 〈 即 “存储 ”) 该 分 组 的 比 
特 。 仅 当 路 由 器 已 经 接收 完了 该 分 组 的 所 有 比特 后 ， 它 才能 开始 向 出 链 路 传输 〈 即 “ 转 
R) 该 分 组 。 为 了 深刻 领悟 存储 转发 传输 ， 我 们 现在 计算 一 下 从 源 开 始 发 送 分 组 到 目的 
地 收 到 整个 分 组 所 经 过 的 时 间 。( 这 里 我 们 将 忽略 传播 时 延 一 一 指 这 些 比特 以 接近 光速 的 
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速度 跨越 线路 所 需要 的 时 间 ， 这 将 在 工 4 节 讨 论 。) 源 在 时 刻 0 开始 传输 ， 在 时 刻 L/R E, 
因为 该 路 由 器 刚好 接收 到 整个 分 组 ， 所 以 它 能 够 朝 着 目的 地 向 出 链 路 开始 传输 分 组 ; 在 时 
刻 27R， 路 由 器 已 经 传输 了 整个 分 组 ， 并 且 整 个 分 组 已 经 被 目的 地 接收 。 所 以 ， 总 时 延 
是 2L/R。 如 果 交 换 机 一 旦 比特 到 达 就 转发 比特 (不必 首 先 收 到 整个 分 组 )， 则 因为 比特 没 
有 在 路 由 器 保存 ， 总 时 延 将 是 LAR。 但 是 如 我 们 将 在 1.4 节 中 讨论 的 那样 ， 路 由 器 在 转发 
前 需要 接收 、 存 储 和 处 理 整个 分 组 。 

现在 我 们 来 计算 从 源 开 始 发 送 第 一 个 分 组 到 目的 地 接收 到 所 有 三 个 分 组 所 需 的 时 间 。 
与 前 面 一 样 ， 在 时 刻 LAR， 路 由 器 开始 转发 第 一 个 分 组 。 而 在 时 刻 L/R 源 也 开始 发 送 第 二 
个 分 组 ， 因 为 它 已 经 完成 了 第 一 个 分 组 的 完整 发 送 。 因 此 ， 在 时 刻 2LAR， 目 的 地 已 经 收 
到 第 一 个 分 组 并 且 路 由 器 已 经 收 到 第 二 个 分 组 。 类 似 地 ， 在 时 刻 3LALR， 目 的 地 已 经 收 到 
前 两 个 分 组 并 且 路 由 器 已 经 收 到 第 三 个 分 组 。 最 后 ， 在 时 刻 4LAR， 目 的 地 已 经 收 到 所 有 3 
个 分 组 ! 

我 们 现在 来 考虑 下 列 一 般 情况 : 通过 由 N 条 速率 均 为 R 的 链 路 组 成 的 路 径 (所 以 ， 
在 源 和 目的 地 之 间 有 NN -1 台 路 由 器 ) ， 从 源 到 目的 地 发 送 一 个 分 组 。 应 用 如 上 相同 的 逻 
辑 ， 我 们 看 到 端 到 端 时 延 是 : 

dys = N= (1-1) 

你 也 许 现在 要 试 着 确定 PP 个 分 组 经 过 NN 条 链 路 序列 的 时 延 有 多 大 。 

2. 排队 时 延 和 分 组 丢失 


每 台 分 组 交换 机 有 多 条 链 路 与 之 相连 。 对 于 每 条 相连 的 链 路 ， 该 分 组 交换 机 具有 一 个 
输出 缓存 (output buffer， 也 称 为 输出 队列 (output queue) ) ， 它 用 于 存储 路 由 器 准备 发 往 
那 条 链 路 的 分 组 。 该 输出 缓存 在 分 组 交换 中 起 着 重要 的 作用 。 如 果 到 达 的 分 组 需要 传输 到 
某 条 链 路 ， 但 发 现 该 链 路 正 忙于 传输 其 他 分 组 ， 该 到 达 分 组 必须 在 输出 缓存 中 等 待 。 因 
- 此， 除了 存储 转发 时 延 以 外 ， 分 组 还 要 承受 输出 缓存 的 排队 时 延 (queuing delay) 。 这 些 时 
延 是 变化 的 ， 变 化 的 程度 取决 于 网 络 的 拥塞 程度 。 因 为 缓存 空间 的 大 小 是 有 限 的 ， 一 个 到 
达 的 分 组 可 能 发 现 该 缓存 已 被 其 他 等 待 传输 的 分 组 完全 充满 了 。 在 此 情况 下 ， 将 出 现 分 组 
ER (EE) (packet loss) ， 到 达 的 分 组 或 已 经 排队 的 分 组 之 一 将 被 丢弃 。 

图 1-12 显示 了 一 个 简单 的 分 组 交换 网 络 。 如 在 图 1-11 中 ， 分 组 被 表示 为 三 维 厚 片 。 
厚 片 的 宽度 表示 了 该 分 组 中 比特 的 数量 。 在 这 张 图 中 ， 所 有 分 组 具有 相同 的 宽度 ， 因 此 有 
相同 的 长 度 。 假 定 主 机 A 和 B 向 主机 发 送 分组。 主机 A 和 B 先 通过 100Mbps 的 以 太 网 
链 路 向 第 一 个 路 由 器 发 送 分 组 。 该 路 由 器 则 将 这 些 分 组 导向 到 一 条 15Mbps 的 链 路 。 在 某 
个 短 时 间 间 隔 内 ， 如 果 分 组 到 达 路 由 器 的 到 达 率 〈 转 换 为 每 秒 比 特 ) 超过 了 15Mbps， 这 
些 分 组 在 通过 链 路 传输 之 前 ， 将 在 链 路 输出 缓存 中 排队 ， 在 该 路 由 器 中 将 出 现 拥 塞 。 例 
如 ， 如 果 主 机 A 和 主机 B 每 个 都 同时 发 送 了 5 个 紧 接 着 的 分 组 罕 发 块 ， 则 这 些 分 组 中 的 大 
多 数 将 在 队列 中 等 待 一 些 时 间 。 事 实 上 ， 这 完全 类 做 于 每 天 都 在 经 历 的 一 些 情况 ， 例 如 当 
我 们 在 银行 柜台 前 排队 等 待 或 在 过 路 收费 站 前 等 待 时 。 我 们 将 在 1. 4 节 中 更 为 详细 地 研究 
这 种 排队 时 延 。 

3. 转发 表 和 路 由 选择 协议 

前 面 我 们 说 过 ， 路 由 器 从 与 它 相连 的 一 条 通信 链 路 得 到 分 组 ， 然 后 向 与 它 相 连 的 另 一 
条 通信 链 路 转发 该 分 组 。 但 是 路 由 器 怎样 决定 它 应 当 向 哪 条 链 路 进行 转发 呢 ? 不 同 的 计算 








机 网 络 实际 上 是 以 不 同 的 方式 完成 分 组 转发 的 。 这 里 ， 我 们 简要 介绍 在 因特网 中 所 采用 的 
方法 。 


等 待 输出 链 路 
的 分 组 队列 





图 例 : D B 
Woa 


图 1-12 分 组 交换 


在 因特网 中 , 每 个 端 系统 具有 一 个 称 为 IP 地 址 的 地 址 。 当 源 主机 要 向 目的 端 系统 发 
送 一 个 分 组 时 ， 源 在 该 分 组 的 首部 包含 了 目的 地 的 IP 地 址 。 如 同 邮 政 地 址 那样 ， 该 地 址 
具有 一 种 等 级 结构 。 当 一 个 分 组 到 达 网 络 中 的 路 由 器 时 ， 路 由 器 检查 该 分 组 的 目的 地 址 的 
一 部 分 ， 并 向 一 台 相 邻 路 由 器 转发 该 分 组 。 更 特别 的 是 ,每 台 路 由 器 具有 一 个 转发 表 
(forwarding table) ， 用 于 将 目的 地 址 (或 目的 地 址 的 一 部 分 ) 映射 成 为 输出 链 路 。 当 某 分 
组 到 达 一 台 路 由 器 时 ， 路 由 器 检查 该 地 址 ， 并 用 这 个 目的 地 址 搜索 其 转发 表 ， 以 发 现 适 当 
的 出 链 路 。 路 由 器 则 将 分 组 导向 该 出 链 路 。 

端 到 端 选 路 过 程 可 以 用 一 个 不 使 用 地 图 而 喜欢 问 路 的 汽车 驾驶 员 来 类 比 。 例 如 ， 假 定 
Joe 驾车 从 费城 到 佛罗里达 州 奥 兰 多 市 的 Lakeside Drive 街 156 号 。Joe 先 驾 车 到 附近 的 加 
油 站 ， 询 问 怎样 才能 到 达 佛罗里达 州 奥兰多 市 的 Lakeside Drive 街 156 号 。 加 油 站 的 服务 
员 从 该 地 址 中 抽取 了 佛罗里达 州 部 分 ， 告 诉 Joe 他 需要 上 工 95 南 州 际 公路 ， 该 公路 恰 有 一 
个 邻近 该 加 油 站 的 人 人口。 他 又 告诉 Joe, 一 旦 到 了 佛罗里达 后 应 当 再 问 当 地 人 。 于 是 ，Joe 
ET 1-95 南 州 际 公 路 ,一直 到达 佛罗里达 的 Jacksonville， 在 那里 他 向 另 一 个 加 油 站 服务 员 
问 路 。 该 服务 员 从 地 址 中 抽取 了 奥兰多 市 部 分 ， 告 诉 Joe 他 应 当 继 续 沿 1-95 公路 到 Dayto- 
na 海滩 ， 然 后 再 问 其 他 人 。 在 Daytona 海滩 ， 另 一 个 加 油 站 服务 员 也 抽取 该 地 址 的 奥兰多 
部 分 ， 告 诉 Joe MHE I-4 公路 直接 前 往 奥兰多 。Joe ET 1-4 公路 ， 并 从 奥兰多 出 口 下 来 。 
Joe 又 向 另 一 个 加 油 站 的 服务 员 询 问 ， 这 时 该 服务 员 抽 取 了 该 地 址 的 Lakeside Drive 部 分 ， 
告诉 了 Joe 到 Lakeside Drive 必须 要 走 的 路 。 一 旦 Joe 到 达 了 Lakeside Drive， 他 向 一 个 骑 自 
行车 的 小 孩 询 问 了 到 达 目 的 地 的 方法 。 这 个 孩子 抽取 了 该 地 址 的 156 号 部 分 ， 并 指示 了 房 
屋 的 方向 。Joe 最 后 到 达 了 最 终 目的 地 。 在 上 述 类 比 中 ， 那 些 加 油 站 服务 员 和 骑 车 的 孩子 
可 类 比 为 路 由 器 。 

我 们 刚刚 学 习 了 路 由 器 使 用 分 组 的 目的 地 址 来 索引 转发 表 并 决定 适当 的 出 链 路 。 但 是 
这 个 叙述 还 要 求 回答 另 一 个 问题 : 转发 表 是 如 何 进行 设置 的 ?是 通过 人 工 对 每 台 路 由 器 逐 
台 进 行 配置 ， 还 是 因特网 使 用 更 为 自动 的 过 程 进行 配置 呢 ? 第 5 章 将 深入 探讨 这 个 问题 。 
但 在 这 里 为 了 激发 你 的 求知 欲 ， 我 们 现在 将 告诉 你 因特网 具有 一 些 特殊 的 路 由 选择 协议 
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(routing protocol) ， 用 于 自动 地 设置 这 些 转发 表 。 和 例如 ， 一 个 路 由 选择 协议 可 以 决定 从 每 
台 路 由 器 到 每 个 目的 地 的 最 短路 径 ， 并 使 用 这 些 最 短路 径 结果 来 配置 路 由 器 中 的 转发 表 。 

怎样 才能 实际 看 到 分 组 在 因特网 中 所 走 的 端 到 端 路 由 呢 ? 我们 现在 请 你 亲手 用 一 下 
Traceroute 程序 。 直 接 访问 站 点 www. traceroute. org ， 在 一 个 特定 的 国家 中 选择 一 个 源 ， 跟 
踪 从 该 源 到 你 的 计算 机 的 路 由 。( 和 参见 1. 4 节 有 关 Traceroute 的 讨论 。) 


1.3.2 电路 交换 


通过 网 络 链 路 和 交换 机 移动 数据 有 两 种 基本 方法 : 电路 交换 (circuit switching) 和 分 
组 交换 〈packet switching)。 上 一 小 节 已 经 讨论 过 分 组 交换 网 络 ， 现 在 我 们 将 注意 力 转向 电 
路 交换 网 络 。 

在 电路 交换 网 络 中 ， 在 端 系统 间 通 信和 会 话 期 间 ， 预 名 了 端 系统 间 沿 路 径 通信 所 需要 的 
资源 (缓存 ， 链 路 传输 速率 ) 。 在 分 组 交换 网 络 中 ， 这 些 资源 则 不 是 预 留 的 ; 会 话 的 报 文 
按 需 使 用 这 些 资 源 ， 其 后 果 可 能 是 不 得 不 等 待 〈 即 排队 ) 接 人 通信 线路 。 一 个 简单 的 类 比 
是 , -考虑 两 家 餐馆 ， 一 家 需要 顾客 预订 ， 而 另 一 家 不 需要 预订 ， 但 不 保证 能 安排 顾客 。 对 
于 需要 预订 的 那 家 和 餐馆， 我 们 在 离开 家 之 前 必须 承受 先 打 电 话 预 订 的 麻烦 ， 但 当 我 们 到 达 
该 餐馆 时 ， 原 则 上 我 们 能 够 立即 人 座 并 点 菜 。 对 于 不 需要 预订 的 那 家 和 餐馆， 我 们 不 必 麻 烦 
地 预订 餐桌 ， 但 当 我 们 到 达 该 餐馆 时 ， 也 许 不 得 不 先 等 待 一 张 餐桌 空闲 后 才能 人 座 。 

传统 的 电话 网 络 是 电路 交换 网 络 的 例子 。 考 虑 当 一 个 人 通过 电话 网 向 另 一 个 人 发 送信 
息 〈 语 音 或 传真 ) 时 所 发 生 的 情况 。 在 发 送 方 能 够 发 送信 息 之 前 ， 该 网 络 必须 在 发 送 方 和 
接收 方 之 间 建 立 一 条 连接 。 这 是 一 个 名 副 其 实 的 连接 ， 因 为 此 时 沿 着 发 送 方 和 接收 方 之 间 
路 径 上 的 交换 机 都 将 为 该 连接 维护 连接 状态 。 用 电话 的 术语 来 说 ， 该 连接 被 称 为 一 条 电路 
(circuit) 。 当 网 络 创建 这 种 电路 时 ， 它 也 在 连接 期 间 在 该 网 络 链 路 上 预 留 了 恒定 的 传输 速 
率 (表示 为 每 条 链 路 传输 容量 的 一 部 分 ) 。 既 然 已 经 为 该 发 送 方 -接收 方 连接 预 留 了 带宽 ， 
则 发 送 方 能 够 以 确保 的 恒定 速率 向 接收 方 传送 数据 。 

图 1-13 显示 了 一 个 电路 交换 网 络 。 在 这 个 网 络 中 ， 用 4 条 链 路 互联 了 4 台电 路 交换 机 。 
这 些 链 路 中 的 每 条 都 有 4 条 电路 ， 因 此 每 条 链 路 能 够 支持 4 条 并 行 的 连接 。 每 台 主机 (例如 
PC 和 工作 站 ) 都 与 一 台 交 换 机 直接 相连 。 
当 两 台 主 机 要 通信 时 ， 该 网 络 在 两 台 主 机 之 
间 创 建 一 条 专用 的 端 到 端 连接 (end-to-end 
connection)。 因 此 ， 主 机 A 为 了 向 主机 也 发 
送 报 文 ， 网 络 必须 在 两 条 链 路 的 每 条 上 先 预 
留 一 条 电路 。 在 这 个 例子 中 ， 这 条 专用 的 端 
到 端 连 接 使 用 第 一 条 链 路 中 的 第 二 条 电路 和 
第 二 条 链 路 中 的 第 四 条 电路 。 因 为 每 条 链 
路 具有 4 条 电路 ， 对 于 由 端 到 端 连接 所 使 
用 的 每 条 链 路 而 言 ， 该 连接 在 连接 期 间 获 
得 链 路 总 传输 容量 的 1/4。 例 如 ， 如 果 两 台 图 1-13 由 4 台 交 换 机 和 4 条 链 路 组 成 的 
邻近 交换 机 之 间 每 条 链 路 具有 1Mbps 传输 一 个 简单 电路 交换 网 络 
速率 ， 则 每 个 端 到 端 电路 交换 连接 获得 250kbps 专用 的 传输 速率 。 

与 此 相反 ， 考 虑 一 台 主 机 要 经 过 分 组 交换 网 络 (如 因特网 ) 向 另 一 台 主 机 发 送 分 组 所 
发 生 的 情况 。 与 使 用 电路 交换 相同 ， 该 分 组 经 过 一 系列 通信 链 路 传输 。 但 与 电路 交换 不 同 
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的 是 ， 该 分 组 被 发 送 进 网 络 ， 而 不 预 留任 何 链 路 资源 之 类 的 东西 。 如 果 因 为 此 时 其 他 分 组 
也 需要 经 该 链 路 进行 传输 而 使 链 路 之 一 出 现 拥 塞 ， 则 该 分 组 将 不 得 不 在 传输 链 路 发 送 侧 的 
缓存 中 等 待 而 产生 时 延 。 因 特 网 尽 最 大 努力 以 实时 方式 交付 分 组 ， 但 它 不 做 任何 保证 。 

1. 电路 交换 网 络 中 的 复 用 

链 路 中 的 电路 是 通过 频 分 复 用 (Frequency- Division Multiplexing, FDM) 或 时 分 复 用 
(Time-Division Multiplexing, TDM) 来 实现 的 。 对 于 FDM， 链 路 的 频谱 由 跨越 链 路 创建 的 
所 有 连接 共享 。 特 别 是 ， 在 连接 期 间 链 路 为 每 条 连接 专用 一 个 频段 。 在 电话 网 络 中 ， 这 个 
频段 的 宽度 通常 为 4kHz ( 即 每 秒 4000 周期 ) 。 毫 无 疑问 ， 该 频段 的 宽度 称 为 带宽 ( band- 
width) 。 调 频 无 线 电 台 也 使 用 FDM 来 共享 88MHz ~ 108MHz 的 频谱 ， 其 中 每 个 电台 被 分 配 
一 个 特定 的 频段 。 

对 于 一 条 TDM 链 路 ， 时 间 被 划分 为 固定 期 间 的 帧 ， 并 且 每 个 帧 又 被 划分 为 固定 数量 
的 时 际 。 当 网 络 跨越 一 条 链 路 创建 一 条 连接 时 ， 网 络 在 每 个 帧 中 为 该 连接 指定 一 个 时 际 。 
这 些 时 隙 专门 由 该 连接 单独 使 用 ， 一 个 时 隙 〈 在 每 个 帧 内 ) 可 用 于 传输 该 连接 的 数据 。 

图 1-14 显示 了 一 个 支持 多 达 4 条 电路 的 特定 网 络 链 路 的 FDM 和 TDM。 对 于 FDM， 其 
频率 域 被 分 割 为 4 个 频段 ， 每 个 频段 的 带宽 是 4kHz。 对 于 TDM， 其 时 域 被 分 割 为 帧 ， 在 . 
每 个 帧 中 具有 4 个 时 际 ， 在 循环 的 TDM 帧 中 每 条 电路 被 分 配 相 同 的 专用 时 队 。 对 于 TDM, 
一 条 电路 的 传输 速率 等 于 帧 速率 乘 以 一 个 时 际 中 的 比特 数量 。 例 如 ， 如 果 链 路 每 秒 传输 
8000 个 帧 ， 每 个 时 隙 由 8 个 比特 组 成 ， 则 每 条 电路 的 传输 速率 是 64kbps。 





所 有 标 有 “2” 的 时 隙 由 一 个 特定 
的 发 送 方 -接收 方 对 所 专用 





图 1-14 对 于 FDM， 每 条 电路 连续 地 得 到 部 分 带宽 。 对 于 TDM， 每 条 电路 在 
短 时 间 间 隔 〈 即 时 辽 ) 中 周期 性 地 得 到 所 有 带宽 


分 组 交换 的 支持 者 总 是 争辩 说 ， 电 路 交换 因为 在 静默 期 (silent period) 专用 电路 空闲 
而 不 够 经 济 。 例 如 ， 打 电话 的 一 个 人 停止 讲话 ， 空 闲 的 网 络 资源 (在 沿 该 连接 路 由 的 链 路 
中 的 频段 或 时 隙 ) 不 能 被 其 他 进行 中 的 连接 所 使 用 。 作 为 这 些 资 源 不 能 有 效 利用 的 男 一 个 
例子 ， 考 虑 一 名 放射 科 医 师 使 用 电路 交换 网 络 远程 存 取 一 系列 X 射线 图 像 。 该 放射 科 医 师 
建立 一 条 连接 ， 请 求 一 幅 图 像 ， 然 后 判读 该 图 像 ， 然 后 再 请 求 一 幅 新 图 像 。 在 放射 科 医 师 
判读 图 像 期 间 ， 网 络 资源 分 配给 了 该 连接 但 没有 使 用 ( 即 被 浪费 了 )。 分 组 交换 的 支持 者 
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还 津津 乐 道 地 指出 ， 创 建 端 到 端 电路 和 预 留 端 到 端 带 宽 是 复杂 的 ， 需 要 复杂 的 信 令 软件 以 
协调 沿 端 到 端 路 径 的 交换 机 的 操作 。 

在 结束 讨论 电路 交换 之 前 ,我们 讨论 一 个 用 数字 表示 的 例子 ， 它 更 能 说 明 问 题 的 实 
质 。 考 虑 从 主机 A 到 主机 B 经 一 个 电路 交换 网 络 发 送 一 个 640 000 比特 的 文件 需要 多 长 
时 间 。 假 如 在 该 网 络 中 所 有 链 路 使 用 具有 24 时 隙 的 TDM， 比 特 速率 为 1. 536Mbps。 同 
时 假定 在 主机 A 能 够 开始 传输 该 文件 之 前 ， 需 要 500ms 创建 一 条 端 到 端 电 路 。 它 需要 多 
长 时 间 才 能 发 送 该 文件 7 每 条 链 路 具有 的 传输 速率 是 1. S36Mbps/24 = 64kbps， 因 此 传 
输 该 文件 需要 (640kb)/(64kbps) =10s。 这 个 10s， 再 加 上 电路 创建 时 间 ， 这 样 就 需要 
10. 5s 发 送 该 文件 。 值 得 注意 的 是 ， 该 传输 时 间 与 链 路 数量 无 关 : 端 到 端 电路 不 管 是 通 
过 一 条 链 路 还 是 100 条 链 路 ， 传 输 时间 都 将 是 10s。( 实 际 的 端 到 端 时 延 还 包括 传播 时 
延 ， 参 见 1.4 节 。) 

2. 分 组 交换 与 电路 交换 的 对 比 


在 描述 了 电路 交换 和 分 组 交换 之 后 ， 我 们 来 对 比 一 下 这 两 者 。 分 组 交换 的 批评 者 经 常 
争辩 说 ， 分 组 交换 不 适合 实时 服务 (例如 ， 电 话 和 视频 会 议 ) ， 因 为 它 的 端 到 端 时 延 是 可 
变 的 和 不 可 预测 的 〈 主 要 是 因为 排队 时 延 的 变动 和 不 可 预测 所 致 ) 。 分 组 交换 的 支持 者 却 
争辩 道 : 中 它 提供 了 比 电路 交换 更 好 的 带宽 共享 ; @ 它 比 电路 交换 更 简单 、 更 有 效 ， 实 现 
成 本 更 低 。 分 组 交换 与 电路 交换 之 争 的 有 趣 讨论 参见 【Molinero- Fernandez 2002 ] 。 概 括 而 
言 ， 嫌 餐馆 预订 麻烦 的 人 宁可 要 分 组 交换 而 不 愿意 要 电路 交换 。 

分 组 交换 为 什么 更 有 效 呢 ? 我 们 看 一 个 简单 的 例子 。 假 定 多 个 用 户 共享 一 条 1Mbps fE 
路 ， 再 假定 每 个 用 户 活路 周期 是 变化 的 ， 某 用 户 时 而 以 100kbps 恒定 速率 产生 数据 ， 时 而 
静止 一 一 这 时 用 户 不 产生 数据 。 进 一 步 假 定 该 用 户 仅 有 10% 的 时 间 活 跃 〈 余 下 的 90% 的 
时 间 空 闲 下 来 喝 咖 啡 ) 。 对 于 电路 交换 ， 在 所 有 的 时 间 内 必须 为 每 个 用 户 预 留 100kbps。 例 
如 ， 对 于 电路 交换 的 TDM， 如 果 一 个 1s 的 帧 被 划分 为 10 个 时 隙 ， 每 个 时 隙 为 100ms， 则 
每 帧 将 为 每 个 用 户 分 配 一 个 时 阶 。 

因此 ， 该 电路 交换 链 路 仅 能 支持 10 ( =1Mbps/100kbps) 个 并 发 的 用 户 。 对 于 分 组 交 
换 ， 一 个 特定 用 户 活路 的 概率 是 0.1《〈 即 10% ) 。 如 果 有 35 个 用 户 ， 有 11 或 更 多 个 并 发 
活跃 用 户 的 概率 大 约 是 0. 0004。( 课 后 习题 PS 概述 如 何 得 到 这 个 概率 值 .) 当 有 10 个 或 
更 少 并 发 用 户 〈 以 概率 0. 9996 RÆ) 时 ， 到 达 的 聚合 数据 速率 小 于 或 等 于 该 链 路 的 输出 
速率 1Mbps。 因 此 ， 当 有 10 个 或 更 少 的 活路 用 户 时 ， 通 过 该 链 路 的 分 组 流 基本 上 没有 时 
延 ， 这 与 电路 交换 的 情况 一 样 。 当 同时 活跃 用 户 超过 10 个 时 ， 分 组 的 聚合 到 达 速 率 超过 
该 链 路 的 输出 容量 ， 则 输出 队列 将 开始 变 长 。( 一 直 增 长 到 聚合 输入 速率 重新 低 于 1Mbps, 
此 后 该 队列 长 度 才 会 减少 。.) 因为 在 本 例子 中 同时 活跃 用 户 超过 10 个 的 概率 极 小 ， 分 组 交 
换 差不多 总 是 提供 了 与 电路 交换 相同 的 性 能 ， 并 且 允 许 在 用 户 数 量 是 其 3 倍 时 情况 也 是 
如 此 。 

我 们 现在 考虑 第 二 个 简单 的 例子 。 假 定 有 10 个 用 户 ， 某 个 用 户 突然 产生 1000 个 1000 
比特 的 分 组 ， 而 其 他 用 户 则 保持 静默 ， 不 产生 分 组 。 在 每 帧 具有 10 个 时 隙 并 且 每 个 时 隙 
包含 1000 比特 的 TDM 电路 交换 情况 下 ， 活 路 用 户 仅 能 使 用 每 帧 中 的 一 个 时 隙 来 传输 数 
据 ， 而 每 个 帧 中 剩余 的 9 个 时 隙 保持 空闲 。 该 活 牙 用 户 传输 完 所 有 10" 比特 数据 需要 10s 
的 时 间 。 在 分 组 交换 情况 下 ,活跃 用 户 能 够 连续 地 以 1Mbps 的 全 部 链 路 速率 发 送 其 分 组 ， 
因为 没有 其 他 用 户 产生 分 组 与 该 活路 用户 的 分 组 进行 复 用 。 在 此 情况 下 ， 该 活路 用 户 的 所 





有 数据 将 在 1s 内 发 送 完毕 。 

上 面 的 例子 从 两 个 方面 表明 了 分 组 交换 的 性 能 能 够 优 于 电路 交换 的 性 能 。 这 些 例子 也 
强调 了 在 多 个 数据 流 之 间 共 享 链 路 传输 速率 的 两 种 形式 的 关键 差异 。 电 路 交换 不 考虑 需 
求 ， 而 预先 分 配 了 传输 链 路 的 使 用 ， 这 使 得 已 分 配 而 并 不 需要 的 链 路 时 间 未 被 利用 。 另 一 
方面 ,分 组 交换 按 需 分 配 链 路 使 用 。 链 路 传输 能 力 将 在 所 有 需要 在 链 路 上 传输 分 组 的 用 户 
之 间 逐 分 组 地 被 共享 。 

虽然 分 组 交换 和 电路 交换 在 今天 的 电信 网 络 中 都 是 普遍 采用 的 方式 ， 但 趋势 无 疑 是 朝 
着 分 组 交换 方向 发 展 。 甚 至 许多 今天 的 电路 交换 电话 网 正在 缓慢 地 向 分 组 交换 迁移 。 特 别 
是 ， 电 话 网 经 常 在 昂贵 的 海外 电话 部 分 使 用 分 组 交换 。 


1.3.3 网 络 的 网 络 


我 们 在 前 面 看 到 ， 端 系统 (PC、 智 能 手机 、Web 服务 器 、 电 子 邮 件 服务 器 等 ) 经 过 
一 个 接 入 ISP 与 因特网 相连 。 该 接 入 ISP 能 够 提供 有 线 或 无 线 连接 ， 使 用 了 包括 DSL, E 
Hi. FITH, WiFi 和 蜂窝 等 多 种 接 人 技术 。 值 得 注意 的 是 ， 接 人 ISP 不 必 是 电信 局 或 电缆 
AFR, 相反 ， 它 能 够 是 如 大 学 (为 学 生 、 教 职员 工 和 从 业 人 员 提 供 因 特 网 接 入 ) 或 公司 
(为 其 雇员 提供 接 入 ) 这 样 的 单位 。 但 让 端 用 户 和 内 容 提 供 商 连接 到 接 入 ISP 仪 解决 了 连 
接 难 题 中 的 很 小 一 部 分 ， 因 为 因特网 是 由 数 以 亿 计 的 用 户 构成 的 。 要 解决 这 个 难题 ， 接 人 
ISP 自身 必须 互联 。 通 过 创建 网 络 的 网 络 可 以 做 到 这 一 点 ， 理 解 这 个 短语 是 理解 因特网 的 
关键 。 

年 复 一 年 ， 构 成 因特网 的 “网 络 的 网 络 ” 已 经 演化 成 为 一 个 非常 复杂 的 结构 。 这 种 演 
化 很 大 部 分 是 由 经 济 和 国家 策略 驱动 的 ， 而 不 是 由 性 能 考虑 驱动 的 。 为 了 理解 今天 的 因 特 
网 的 网 络 结构 ， 我 们 以 逐步 递 进 方式 建造 一 系列 网 络 结构 ， 其 中 的 每 个 新 结构 都 更 好 地 接 
近 现 在 的 复杂 因特网 。 回 顾 前 面 互联 接 入 ISP 的 中 心目 标 ， 是 使 所 有 端 系 统 能 够 彼此 发 送 
分 组 。 一 种 幼稚 的 方法 是 使 每 个 接 人 ISP 直接 与 每 个 其 他 接 入 ISP 连接 。 当 然 ， 这 样 的 网 
状 设 计 对 于 接 人 ISP 费用 太 高 ， 因 为 这 将 要 求 每 个 接 人 ISP 要 与 世界 上 数 十 万 个 其 他 接 人 
ISP 有 一 条 单独 的 通信 和 链 路 。 

我 们 的 第 一 个 网 络 结构 即 网 络 结构 1， 用 单一 的 全 球 传 输 ISP 互联 所 有 接 入 ISP。 我 们 
假想 的 全 球 传输 ISP 是 一 个 由 路 由 器 和 通信 和 链 路 构成 的 网 络 ， 该 网 络 不 仅 跨越 全 球 ， 而 且 
至 少 具有 一 台 路 由 器 靠近 数 十 万 接 人 ISP 中 的 每 一 个 。 当 然 ， 对 于 全 球 传输 I SP， 建造 这 
样 一 个 大 规模 的 网 络 将 耗资 巨大 。 为 了 有 利 可 图 ， 自 然 要 向 每 个 连接 的 接 人 ISP 收费 ， 其 
价格 反映 (并 不 一 定 正比 于 ) 一 个 接 入 ISP 经 过 全 球 ISP 交换 的 流量 大 小 。 因 为 接 人 ISP 
向 全 球 传 输 ISP 付费 ， 故 接 入 ISP 被 认为 是 客户 (customer) ， 而 全 球 传输 ISP 被 认为 是 提 
供 商 (provider) 。 

如 果 某 个 公司 建立 并 运营 一 个 可 赢利 的 全 球 传输 ISP， 其 他 公司 建立 自己 的 全 球 传输 
ISP 并 与 最 初 的 全 球 传输 ISP 竞争 则 是 一 件 自然 的 事 。 这 导致 了 网 络 结构 2， 它 由 数 十 万 接 
A ISP 和 多 个 全 球 传输 ISP 组 成 。 接 入 ISP 无 疑 喜欢 网 络 结构 2 胜 过 喜欢 网 络 结构 1， 因为 
它们 现在 能 够 根据 价格 和 服务 因素 在 多 个 竞争 的 全 球 传输 提供 商 之 间 进 行 选择 。 然 而 ， 值 
得 注意 的 是 ， 这 些 全 球 传输 ISP 之 间 必 须 是 互联 的 ; 不 然 的 话 ， 与 某 个 全 球 传输 ISP 连接 
的 接 入 ISP 将 不 能 与 连接 到 其 他 全 球 传输 ISP AREA ISP 进行 通信 。 

刚才 描述 的 网 络 结构 2 是 一 种 两 层 的 等 级 结构 ， 其 中 全 球 传输 提供 商 位 于 顶层 ， 而 接 
入 ISP 位 于 底层 。 这 假设 了 全 球 传输 ISP 不 仅 能 够 接近 每 个 接 入 TSP， 而 且 发 现 经 济 上 也 
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希望 这 样 做 。 现 实 中 ， 尽 管 某 些 ISP 确实 具有 令 人 印象 深刻 的 全 球 覆 盖 ， 并 且 确 实 直接 与 
许多 接 人 ISP 连接 ， 但 世界 上 没有 哪个 ISP 是 无 处 不 在 的 。 相反 ， 在 任何 给 定 的 区 域 ， 可 
能 有 一 个 区 域 ISP (regional ISP) ， 区 域 中 的 接 人 ISP 与 之 连接 。 每 个 区 域 SP 则 与 第 一 层 
ISP (tier-1 ISP) 连接 。 第 一 层 ISP 类 似 于 我 们 假想 的 全 球 传输 ISP， 尽 管 它 不 是 在 世界 上 
每 个 城市 中 都 存在 ， 但 它 确实 存在 。 有 大 约 十 几 个 第 一 层 ISP， 包括 Level 3 Communica- 
tions, AT&T, Sprint 和 NTT。 有 趣 的 是 ， 没 有 组 织 正式 认可 第 一 层 状态 。 俗 话说 : 如 果 必 
须 问 你 是 否 是 一 个 组 织 的 成 员 ， 你 可 能 不 是 。 

再 来 讨论 这 个 网 络 的 网 络 ， 不仅 有 多 个 竞争 的 第 一 层 ISP， 而 且 在 一 个 区 域 可 能 有 多 
个 竞争 的 区 域 SP。 在 这 样 的 等 级 结构 中 ， 每 个 接 入 ISP 向 其 连接 的 区 域 ISP 支付 费用 ， 
并 且 每 个 区 域 ISP 向 它 连接 的 第 一 层 ISP 支付 费用 。( 一 个 接 入 ISP 也 能 直接 与 第 一 层 ISP 
连接 ， 这样 它 就 向 第 一 层 ISP 付费 .) 因此 ， 在 这 个 等 级 结构 的 每 一 层 ， 都 有 客户 - 提供 
商 关 系 。 值 得 注意 的 是 ， 第 一 层 ISP 不 向 任何 人 付费 ， 因 为 它们 位 于 该 等 级 结构 的 顶部 。 
更 为 复杂 的 情况 是 ， 在 某 些 区 域 ， 可 能 有 较 大 的 区 域 SP (可 能 跨越 整个 国家 ) ， 该 区 域 
中 较 小 的 区 域 ISP 与 之 相连 ， 较 大 的 区 域 ISP 则 与 第 一 层 ISP 连接 。 例 如 ， 在 中 国 ， 每 个 
城市 有 接 人 ISP， 它 们 与 省 级 ISP 连接 ， 省 级 ISP 又 与 国家 级 ISP 连接 ， 国 家 级 ISP MAH 
第 一 层 ISP 连接 [Tian 2012 ] 。 这 个 多 层 等 级 结构 仍然 仅仅 是 今天 因特网 的 粗略 近似 ， 我 
们 称 它 为 网 络 结构 3。 

为 了 建造 一 个 与 今天 的 因特网 更 为 相似 的 网 络 ， 我 们 必须 在 等 级 化 网 络 结构 3 上 增加 
存在 点 (Point of Presence，PoP) 、 多 宿 、 对 等 和 因特网 交换 点 。PoP 存在 于 等 级 结构 的 所 
有 层次 ,但 底层 (GZA ISP) 等 级 除外 。 一 个 PoP 只 是 提供 商 网 络 中 的 一 台 或 多 台 路 由 器 
(在 相同 位 置 ) 群 组 ， 其 中 客户 ISP 能 够 与 提供 商 ISP 连接 。 对 于 要 与 提供 商 PoP 连接 的 
客户 网 络 ， 它 能 从 第 三 方 电信 提供 商 租 用 高 速 链 路 将 它 的 路 由 器 之 一 直接 连接 到 位 于 该 
PoP 的 一 台 路 由 器 。 任 何 ISP 〈〔( 除 了 第 一 层 .ISP) 可 以 选择 多 宿 (multi-home) ， 即 可 以 与 
两 个 或 更 多 提供 商 ISP 连接 。 例 如 ， 一 个 接 人 ISP 可 能 与 两 个 区 域 ISP 多 和 宿 ， 既 可 以 与 两 
个 区 域 ISP 多 宿 ， 也 可 以 与 一 个 第 一 层 ISP 多 宿 。 当 一 个 ISP 多 宿 时 ， 即 使 它 的 提供 商 之 
一 出 现 故障 ， 它 仍然 能 够 继续 发 送 和 接收 分 组 。 

正如 我 们 刚才 学 习 的 ， 客 户 ISP 向 它们 的 提供 商 ISP 付费 以 获得 全 球 因特网 互联 能 力 。 
客户 ISP 支付 给 提供 商 ISP 的 费用 数额 反映 了 它 通过 提供 商 交 换 的 通信 流量 。 为 了 减少 这 
些 费用 ， 位 于 相同 等 级 结构 层次 的 邻近 一 对 ISP 能 够 对 等 (peer) ， 也 就 是 说 ， 能 够 直接 
将 它们 的 网 络 连 到 一 起 ， 使 它们 之 间 的 所 有 流量 经 直接 连接 而 不 是 通过 上 游 的 中 间 ISP 传 
输 s- 当 两 个 ISP 对 等 时 ， 通 常 不 进行 结算 ， 即 任 一 个 ISP 不 向 其 对 等 付费 。 如 前 面 提 到 的 
那样 ， 第 一 层 ISP 也 与 另 一 个 第 一 层 ISP 对 等 ， 它 们 之 间 无 结算 。 对 于 对 等 和 客户 - 提供 
商 关系 的 讨论 ，[ Van der Berg 2008] 是 一 本 不 错 的 读物 。 沿 着 这 些 相 同 路 线 ， 第 三 方 公 司 
能 够 创建 一 个 因特网 交换 点 (Internet Exchange Point，IXP) ，IXP 是 一 个 汇合 点 ， 多 个 ISP 
能 够 在 这 里 一 起 对 等 。IXP 通常 位 于 一 个 有 自己 的 交换 机 的 独立 建筑 物 中 [Ager 2012], 
在 今天 的 因特网 中 有 400 多 个 IXP [IXP List 2016] 。 我 们 称 这 个 生态 系统 为 网 络 结构 
4 一 一 由 接 入 ISP、 区 域 ISP、 第 一 层 IJSP、PoP、 多 宿 、 对 等 和 JIXP 组 成 。 

我 们 现在 最 终 到 达 了 网 络 结 构 5， 它 描述 了 现今 的 因特网 。 在 图 1-15 中 显示 了 网 络 结 
构 5， 它 通过 在 网 络 结构 4 顶部 增加 内 容 提供 商 网 络 (content provider network) 构建 而 成 。 
谷歌 是 当前 这 样 的 内 容 提供 商 网 络 的 一 个 突出 例子 。 在 本 书写 作 之 时 ， 人 谷歌 估计 有 50 ~ 
100 个 数据 中 心 分 布 于 北美 、 欧 洲 、 亚 洲 、 南 美和 澳大利亚 。 其 中 的 某 些 数据 中 心 容纳 了 
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超过 十 万 台 的 服务 器 ， 而 另 一 些 数据 中 心 则 较 小 ， 仅 容纳 数 百 台 服 务 器 。 谷 歌 数据 中 心 都 
经 过 专用 的 TCP/IP 网 络 互联 ， 该 网 络 跨越 全 球 ， 不 过 独立 于 公共 因特网 。 重 要 的 是 ， 谷 
歌 专 用 网 络 仅 承载 出 入 谷歌 服务 器 的 流量 。 如 图 1-15 所 示 ， 谷 歌 专 用 网 络 通过 与 较 低层 
ISP 对 等 (无 结算 ) ， 尝 试 “ 绕 过 ”因特网 的 较 高 层 ， 采 用 的 方式 可 以 是 直接 与 它们 连接 ， 
或 者 在 IXP 处 与 它们 连接 [Labovitz 2010 ] 。 然 而 ， 因 为 许多 接 人 ISP 仍然 仅 能 通过 第 一 层 
网 络 的 传输 到 达 ， 所 以 谷歌 网 络 也 功 第 一 层 ISP 连接 ， 并 就 与 这 些 ISP 交换 的 流量 向 它们 
付费 。 通 过 创建 自己 的 网 络 ， 内 容 提 供 商 不 仅 减少 了 向 顶层 ISP 支付 的 费用 ， 而 且 对 其 服 
务 最 终 如 何 交付 给 端 用 户 有 了 更 多 的 控制 。 谷 歌 的 网 络 基础 设施 在 2.6 节 中 进行 了 详细 
描述 。 





图 1-15 ISP 的 互联 


总 结 一 下 ， 今 天 的 因特网 是 一 个 网 络 的 网 络 ， 其 结构 复杂 ， 由 十 多 个 第 一 层 ISP 和 数 
十 万 个 较 低 层 ISP 组 成 。ISP 覆盖 的 区 域 多 种 多 样 ， 有 些 跨越 多 个 大 洲 和 大 洋 ， 有 些 限 于 
狭窄 的 地 理 区 域 。 较 低层 的 ISP 与 较 高 层 的 ISP 相连 ， 较 高 层 ISP 彼此 互联 。 用 户 和 内 容 
提供 商 是 较 低层 ISP 的 客户 ， 较 低层 ISP 是 较 高 层 ISP 的 客户 。 近 年 来 ， 主 要 的 内 容 提供 
商 也 已 经 创建 自己 的 网 络 ， 直 接 在 可 能 的 地 方 与 较 低层 ISP 互联 。 


1.4 分 组 交换 网 中 的 时 延 、 丢 包 和 吞吐 量 


回想 在 1. 1 节 中 我 们 讲 过 ， 因 特 网 能 够 看 成 是 一 种 基础 设施 ， 该 基础 设施 为 运行 在 端 
系统 上 的 分 布 式 应 用 提供 服务 。 在 理想 情况 下 ， 我 们 希望 因特网 服务 能 够 在 任意 两 个 端 系 
统 之 间 随 心 所 欲 地 瞬间 移动 数据 而 没有 任何 数据 丢失 。 然 而 ， 这 是 一 个 极 高 的 目标 ， 实 践 
中 难以 达到 。 与 之 相反 ， 计 算 机 网 络 必定 要 限制 在 端 系统 之 间 的 吞吐 量 (每 秒 能 够 传送 的 
数据 量 ) ， 在 端 系统 之 间 引 入 时 延 ， 而 且 实际 上 也 会 丢失 分 组 。 一 方面 ， 现 实 世界 的 物理 
定律 引入 的 时 延 、 丢 包 并 限制 吞吐 量 是 不 幸 的 。 而 另 一 方面 ， 因 为 计算 机 网 络 存在 这 些 问 
题 ， 围 绕 如 何 去 处 理 这 些 问 题 有 许多 令 人 着 迷 的 话题 ， 多 得 足以 开设 一 门 有 关 计算 机 网 络 
方面 的 课程 ， 可 以 做 上 千 篇 博 士 论 文 ! 在 本 节 中 ， 我 们 将 开始 研究 和 量化 计算 机 网 络 中 的 
时 延 、 丢 包 和 吞吐 量 等 问题 。 


1.4.1 分 组 交换 网 中 的 时 延 概述 
前 面 讲 过 , 分 组 从 一 台 主 机 ( 源 ) 出 发 ， 通 过 一 系列 路 由 器 传输 ， 在 另 一 台 主 机 
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(目的 地 ) 中 结束 它 的 历程 。 当 分 组 从 一 个 节点 (主机 或 路 由 器 ) 沿 着 这 条 路 径 到 后 继 节 
点 (主机 或 路 由 器 )， 该 分 组 在 沿途 的 每 个 节点 经 受 了 几 种 不 同类 型 的 时 延 。 这 些 时 延 最 
为 重要 的 是 节点 处 理 时 延 (nodal processing delay) 、 排 队 时 延 (queuing delay) 、 传 输 时 延 
(transmission delay) 和 传播 时 延 (propagation delay) ， 这 些 时 延 总 体 累加 起 来 是 节点 总 时 
JE (total nodal delay) 。 许 多 因特网 应 用 ， 如 搜索 、Web 浏览 、 电 子 邮件 、 地 图 、 即 时 讯 
息 和 下 语音 ,它们 的 性 能 受 网 络 时 延 的 影响 很 大 。 为 了 深入 理解 分 组 交换 和 计算 机 网 络 ， 
我 们 必须 理解 这 些 时 延 的 性 质 和 重要 性 。 

时 延 的 类 型 

我 们 来 探讨 一 下 图 1-16 环境 中 的 这 些 时 延 。 作 为 源 和 目的 地 之 间 的 端 到 端 路 由 的 一 
部 分 ， 一 个 分 组 从 上 游 节 点 通过 路 由 器 A 向 路 由 器 .B 发 送 。 我 们 的 目标 是 在 路 由 器 A 刻 
画 出 节点 时 延 。 值 得 注意 的 是 ， cee ea ees, Cee 
队列 〈 也 称 为 缓存 ) 。 当 分 组 从 上 游 
节点 到 达 路 由 器 A 时 ， 路 由 器 A 检查 
该 分 组 的 首部 以 决定 它 的 适当 出 链 路 ， 
并 将 该 分 组 导向 该 链 路 。 在 这 个 例子 
中 ， 对 该 分 组 的 出 链 路 是 通 向 路 由 器 
B 的 那 条 链 路 。 仅 当 在 该 链 路 没有 其 
他 分 组 正在 传输 并 且 没 有 其 他 分 组 排 
在 该 队列 前 面 时 ， 才 能 在 这 条 链 路 上 salt sa de Ulan 
传输 该 分 组 ; 如 果 该 链 路 当前 正 繁忙 或 有 其 他 分 组 已 经 在 该 链 路 上 排队 ， 则 新 到 达 的 分 组 
将 加 入 排队 。 

(1) 处 理 时 延 

检查 分 组 首部 和 决定 将 该 分 组 导向 何 处 所 需要 的 时 间 是 处 理 时 延 的 一 部 分 。 处 理 时 延 
也 能 够 包括 其 他 因素 ， 如 检查 比特 级 别 的 差错 所 需要 的 时 间 ， 该 差错 出 现在 从 上 游 节 点 向 
路 由 器 A 传输 这 些 分 组 比特 的 过 程 中 。 高 速 路 由 器 的 处 理 时 延 通常 是 微 秒 或 更 低 的 数量 
级 。 在 这 种 节点 处 理 之 后 ， 路 由 器 将 该 分 组 引 向 通 往 路 由 器 B 链 路 之 前 的 队列 。 (在 第 4 
章 中 ,我 们 将 研究 路 由 器 运行 的 细节 。) 

(2) 排队 时 延 

在 队列 中 ， 当 分 组 在 链 路 上 等 待 传输 时 ， 它 经 受 排队 时 延 。 一 个 特定 分 组 的 排队 时 延长 
度 将 取决 于 先期 到 达 的 正在 排队 等 待 向 链 路 传输 的 分 组 数量 。 如 果 该 队列 是 空 的 ， 并 且 当 前 
没有 其 他 分 组 正在 传输 ， 则 该 分 组 的 排队 时 延 为 0。 另 一 方面 ， 如 果 流 量 很 大 ， 并 且 许 多 其 
他 分 组 也 在 等 待 传输 ， 该 排队 时 延 将 很 长 。 我 们 将 很 快 看 到 ， 到 达 分 组 期 待 发 现 的 分 组 数量 
是 到 达 该 队列 的 流量 的 强度 和 性 质 的 函数 。 实 际 的 排队 时 延 可 以 是 毫秒 到 微 秒 量 级 。 

(3) 传输 时 延 

假定 分 组 以 先 到 先 服务 方式 传输 一 一 这 在 分 组 交换 网 中 是 常见 的 方式 , 仅 当 所 有 已 经 
到 达 的 分 组 被 传输 后 ， 才 能 传输 刚 到 达 的 分 组 。 用 工 比特 表示 该 分 组 的 长 度 ， 用 R bps 
( 即 b/s) 表示 从 路 由 器 A 到 路 由 器 B 的 链 路 传输 速率 。 例 如 ， 对 于 一 条 10Mbps 的 以 太 网 
链 路 ， 速 率 尺 =10Mbps; 对 于 100Mbps 的 以 太 网 链 路 ， 速 率 尺 =100Mbps。 传 输 时 延 是 L/ 
R。 这 是 将 所 有 分 组 的 比特 推 向 链 路 ( 即 传输 ,或 者 说 发 射 ) 所 需要 的 时 间 。 实 际 的 传输 
时 延 通常 在 毫秒 到 微 秒 量 级 。 
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(4) 传播 时 延 

一 旦 一 个 比特 被 推 向 链 路 ， 该 比特 需要 向 路 由 器 B 传播 。 从 该 链 路 的 起 点 到 路 由 需 也 
传播 所 需要 的 时 间 是 传播 时 延 。 该 比特 以 该 链 路 的 传播 速率 传播 。 该 传播 速率 取决 于 该 链 
路 的 物理 媒体 〈 即 光纤 、 双 绞 铜 线 等 ) ， 其 速率 范围 是 2 x 10 ~3 x10 m/s， 这 等 于 或 略 小 
于 光速 。 该 传播 时 延 等 于 两 台 路 由 器 之 间 的 距离 除 以 传播 速率 。 即 传播 时 延 是 ws， 其 中 
d 是 路 由 器 A 和 路 由 器 B 之 间 的 距离 ，s 是 该 链 路 的 传播 速率 。 一 旦 该 分 组 的 最 后 一 
特 传 播 到 节点 B， 该 比特 及 前 面 的 所 有 比特 被 存储 于 路 由 器 B。 整 个 过 程 将 随 着 路 由 器 B 
执行 转发 而 持续 下 去 。 在 广域网 中 ， 传 播 时 延 为 毫秒 量 级 。 

(5) 传输 时 延 和 传播 时 延 的 比较 

计算 机 网 络 领域 的 新 手 有 时 难以 理解 传输 时 延 和 传播 时 延 之 间 的 差异 。 该 差异 是 微妙 
而 重要 的 。 传 输 时 延 是 路 由 器 推出 分 组 所 需要 的 时 间 ， 它 是 分 组 长 度 和 链 路 传输 速率 的 函 
数 ， 而 与 两 台 路 由 器 之 间 的 距离 无 关 。 另 一 方面 ， 传 播 时 延 是 一 个 比特 从 一 台 路 由 器 传播 
到 另 一 台 路 由 器 所 需要 的 时 间 ， 它 是 两 台 路 由 器 之 间距 离 的 函数 ， 而 与 分 组 长 度 或 链 路 传 
输 速 率 无 关 。 

一 个 类 比 可 以 曾 明 传输 时 延 和 传播 时 延 的 概念 。 考 虑 一 条 公路 每 100km 有 一 个 收费 
站 ， 如 图 1-17 所 示 。 可 认为 收费 站 间 的 公路 段 是 链 路 ， 收 费 站 是 路 由 器 。 假 定 汽车 以 
100km/h 的 速度 〔 也 就 是 说 当 一 辆 汽车 离开 一 个 收费 站 时 ， 它 立即 加 速 到 100km/h 并 在 收 
费 站 间 维 持 该 速度 ) 在 该 公路 上 行驶 〈 即 传播 ) 。 假 定 这 时 有 10 辆 汽车 作为 一 个 车 队 在 行 
Be, 并且 这 10 辆 汽车 以 固定 的 顺序 互相 跟随 。 可 以 认为 每 辆 汽车 是 一 个 比特 ， 该 车 队 是 

一 个 分 组 。 同 时 假定 每 个 收费 站 以 每 辆 车 12s 的 速度 服务 〈 即 传输 ) 一 辆 汽车 ， 并 且 由 于 
时 间 是 深夜 ， 因 此 该 车 队 是 公路 上 唯一 一 批 汽车 。 最 后 ， 假 定 无 论 该 车 队 的 第 一 辆 汽车 何 
时 到 达 收 费 站 ， 它 在 入口 处 等 待 ， 直 到 其 他 9 辆 汽车 到 达 并 整 队 依次 前 行 。( 因 此， 整个 
车 队 在 它 能 够 “转发 ”之 前 ， 必 须 存储 在 收费 站 。) 收费 站 将 整个 车 队 推 向 公路 所 需要 的 
时 间 是 (10 辆 车 )/(5 辆 车 /min) =2min。 该 时 间 类 比 于 一 台 路 由 器 中 的 传输 时 延 。 一 辆 
汽车 从 一 个 收费 站 出 口 行驶 到 下 一 个 收费 站 所 需要 的 时 间 是 100km/ (100km/h) = 1h。 这 
个 时 间 类 比 于 传播 时 延 。 因 此 ， 从 该 车 队 存储 在 收费 站 前 到 该 车 队 存 储 在 下 一 个 收费 站 前 
的 时 间 是 “传输 时 延 ” 与 “传播 时 间 ” 总 和 ， 在 本 例 中 为 62min。 
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10 辆 汽车 的 车 队 收费 站 收费 站 
图 1-17 车 队 的 类 比 


我 们 更 深入 地 探讨 一 下 这 个 类 比 。 如 果 收 费 站 对 车 队 的 服务 时 间 大 于 汽车 在 收费 站 之 
间 行 驶 的 时 间 ， 将 会 发 生 什 么 情况 呢 ? 例如 ， 假 定 现 在 汽车 是 以 1000km/h 的 速率 行驶 ， 
收费 站 是 以 每 分 钟 一 辆 汽车 的 速率 为 汽车 服务 。 则 汽车 在 两 个 收费 站 之 间 的 行驶 时 延 是 
6min， 收 费 站 为 车 队 服务 的 时 间 是 10min。 在 此 情况 下 ， 在 该 车 队 中 的 最 后 几 辆 汽车 离开 
第 一 个 收费 站 之 前 ， 该 车 队 中 前 面 的 几 辆 汽车 将 会 达到 第 二 个 收费 站 。 这 种 情况 在 分 组 交 
换 网 中 也 会 发 生 ， 一 个 分 组 中 的 前 几 个 比特 到 达 了 一 台 路 由 器 ， 而 该 分 组 中 许多 余下 的 比 
特 仍然 在 前 面 的 路 由 器 中 等 待 传输 。 

如 果 说 一 图 胜 千 言 的 话 ， 则 一 个 动画 必定 胜 百 万 言 。 与 本 书 配 套 的 Web 网 站 提供 了 
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一 个 交互 式 Java 小 程序 ， 它 很 好 地 展现 及 对 比 了 传输 时 延 和 传播 时 延 。 我 们 极力 推荐 读者 
访问 该 Java 小 程序 。[ Smith 2009] 也 提供 了 可 读 性 很 好 的 有 关 传 播 、 排 队 和 传输 时 延 的 
讨论 。 

WRG dr 、dune、dum 和 dm 分 别 表示 处 理 时 延 、 排 队 时 延 、 传 输 时 延 和 传播 时 延 ， 
则 节点 的 总 时 延 由 下 式 给 定 : 

这 些 时 延 成 分 所 起 的 作用 可 能 会 有 很 大 的 不 同 。 例 如 ， 对 于 连接 两 台 位 于 同一 个 大 学 
校园 的 路 由 器 的 链 路 而 言 ，duw 可 能 是 微不足道 的 《例如 ， 刀 微 秒 ) ; 然而， 对 于 由 同步 
卫星 链 路 互联 的 两 台 路 由 器 来 说 ，duw 是 几 百 毫秒 ， 能 够 成 为 lu 中 的 主要 成 分 。 类 似 
地 ，duw 的 影响 可 能 是 微不足道 的 ， 也 可 能 是 很 大 的 。 通 常 对 于 10Mbps 和 更 高 的 传输 速 
率 (例如 ,对 于 LAN) 的 信道 而 言 ， 它 的 影响 是 微不足道 的 ;然而 ， 对 于 通过 低速 拨号 
调制 解 调 器 链 路 发 送 的 长 因特网 分 组 而 言 ， 可 能 是 数 百 毫秒 。 处 理 时 延 dr 通常 是 微 不 足 
道 的 ; 然而 ， 它 对 一 台 路 由 器 的 最 大 吞吐 量 有 重要 影响 ， 最 大 吞吐 量 是 一 台 路 由 天 能 够 转 
发 分 组 的 最 大 速率 。 


1.4.2 排队 时 延 和 丢 包 


节点 时 延 的 最 为 复杂 和 有 趣 的 成 分 是 排队 时 延 di,。.。 事 实 上 ， 排 队 时 延 在 计算 机 网 络 
中 的 重要 程度 及 人 们 对 它 感 兴趣 的 程度 ， 从 发 表 的 数 以 千 计 的 论文 和 大 量 专著 的 情况 可 见 
一 斑 [Bertsekas 1991; Daigle 1991; Kleinrock 1975, 1976; Ross 1995 ] 。 我 们 这 里 仅 给 出 
有 关 排 队 时 延 的 总 体 的 、 直 觉 的 讨论 ; 求知 欲 强 的 读者 可 能 要 浏览 某 些 书籍 〈 或 者 最 终 写 
有 关 这 方面 的 博士 论文 ) 。 与 其 他 3 项 时 延 ( 即 di 、dus 和 duw) 不 同 的 是 ， 排 队 时 延 对 
不 同 的 分 组 可 能 是 不 同 的 。 例 如 ， 如 果 10 个 分 组 同时 到 达 空 队列 ， 传 输 的 第 一 个 分 组 没 
有 排队 时 延 ， 而 传输 的 最 后 一 个 分 组 将 经 受 相 对 大 的 排队 时 延 (这 时 它 要 等 待 其 他 9 个 分 
-组 被 传输 )。 因 此 ， 当 表征 排队 时 延 时 ， 人 们 通常 使 用 统计 量 来 度量 ， 如 平均 排队 时 延 、 
排队 时 延 的 方差 和 排队 时 延 超 过 某 些 特定 值 的 概率 。 

什么 时 候 排 队 时 延 大 ， 什 么 时 候 又 不 大 呢 ? 该 问题 的 答案 很 大 程度 取决 于 流量 到 达 该 
队列 的 速率 、 链 路 的 传输 速率 和 到 达 流 量 的 性 质 ， 即 流量 是 周期 性 到 达 还 是 以 突 发 形式 到 
达 。 为 了 更 深入 地 领会 某 些 要 点 , O a 表示 分 组 到 达 队 列 的 平均 速率 (a 的 单位 是 分 组 / 
秒 ， 即 pkt/s)。 前 面 讲 过 RR 是 传输 速率 ， 即 从 队列 中 推出 比特 的 速率 ( 以 bps Bil b/s 为 单 
位 )。 为 了 简单 起 见 ， 也 假定 所 有 分 组 都 是 由 工 比特 组 成 的 。 则 比特 到 达 队 列 的 平均 速率 
是 La bps。 最 后 ， 假 定 该 队列 非常 大 ， 因 此 它 基 本 能 容纳 无 限 数量 的 比特 。 比 率 La/R 被 
称 为 流量 强度 (traffic intensity) ， 它 在 估计 排队 时 延 的 范围 方面 经 常 起 着 重要 的 作用 。 如 
SR Za/R>1， 则 比特 到 达 队 列 的 平均 速率 超过 从 该 队列 传输 出 去 的 速率 。 在 这 种 不 幸 的 情 
况 下 ， 该 队列 趋向 于 无 限 增加 ， 并 且 排 队 时 延 将 趋向 无 穷 大 ! 因此 ， 流 量 工 程 中 的 一 条 金 
科 玉 律 是 : 设计 系统 时 流量 强度 不 能 大 于 1。 

现在 考虑 Le/R<1 时 的 情况 。 这 时 ， 到 达 流 量 的 性 质 影 响 排队 时 延 。 例 如 ， 如 果 分 组 
周期 性 到 达 ， 即 每 L/R 秒 到 达 一 个 分 组 ， 则 每 个 分 组 将 到 达 一 个 空 队列 中 ， 不 会 有 排队 时 
延 。 男 一 方面 ， 如 果 分 组 以 突 发 形式 到 达 而 不 是 周期 性 到 达 ， 则 可 能 会 有 很 大 的 平均 排队 
时 延 。 例 如 ， 假 定 每 (LAR)N 秒 同时 到 达 N 个 分 组 。 则 传输 的 第 一 个 分 组 没有 排队 时 延 ; 
传输 的 第 二 个 分 组 就 有 L/R 秒 的 排队 时 延 ; 更 为 一 般 地 ;第 nn 个 传输 的 分 组 具有 (n 一 1) 
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L/R 秒 的 排队 时 延 。 我 们 将 该 例子 中 的 计算 平均 排队 时 延 的 问题 留 给 读者 作为 练习 。 

以 上 描述 周期 性 到 达 的 两 个 例子 有 些 学 术 味 。 通 常 ， 到 达 队 列 的 过 程 是 随机 的 ， 即 到 
达 并 不 遵循 任何 模式 ， 分 组 之 间 的 时 间 间 隔 是 随机 的 。 在 这 种 更 为 真实 的 情况 下 ， 量 La/ 
及 通常 不 足以 全 面 地 表征 时 延 的 统计 量 。 不 过 ， 直 观 地 理解 排队 时 延 的 范围 很 有 有 用。 特别 
是 ， 如 果 流 量 强度 接近 于 0， 则 几乎 没有 分 组 到 达 并 且 到 达 间 隔 很 大 ， 那 么 到 达 的 分 组 将 
不 可 能 在 队列 中 发 现 别 的 分 组 。 因 此 ， 平 均 排 队 时 延 将 接近 0。 另 一 方面 ， 当 流量 强度 接 
近 1 时 ， 当 到 达 速 率 超过 传输 能 力 (由 于 分 组 到 达 速 率 的 波动 ) 时 将 存在 时 间 间 隔 ， 在 这 
些 时 段 中 将 形成 队列 。 当 到 达 速 率 小 于 传输 能 力 时 ， 
队列 的 长 度 将 缩短 。 无 论 如 何 ， 随 着 流量 强度 接近 1, 
平均 排队 长 度 变 得 越 来 越 长 。 平 均 排队 时 延 与 流量 强 
度 的 定性 关系 如 图 1-18 所 示 。 

图 1-18 的 一 个 重要 方面 是 这 样 一 个 事实 : 随 着 
流量 强度 接近 于 1， 平均 排队 时 延 迅 速 增加 。 该 强度 
的 少量 增加 将 导致 时 延 大 比例 增加 。 也 许 你 在 公路 上 
经 历 过 这 种 事 。 如 果 在 经 常 拥塞 的 公路 上 像 平时 一 样 
驾驶 ， 这 条 路 经 常 拥塞 的 事实 意味 着 它 的 流量 强度 接 
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近 于 1， 如 果 某 些 事件 引起 一 个 即便 是 稍微 大 于 平常 
量 的 流量 ， 经 受 的 时 延 就 可 能 很 大 。 图 1-18 平均 排队 时 延 与 
为 了 实际 感受 一 下 排队 时 延 的 情况 ,我 们 再 次 鼓 流量 强度 的 关系 


励 你 访问 本 书 的 Web 网 站 ,该 网 站 提供 了 一 个 有 关 队 列 的 交互 式 Java 小 程序 。 如 果 你 将 
分 组 到 达 速 率 设置 得 足够 大 ， 使 流量 强度 超过 1， 那么 将 看 到 经 过 一 段 时 间 后 ， 队 列 慢 慢 
地 建立 起 来 。 

丢 包 


在 上 述 讨 论 中 ， 我 们 已 经 假设 队列 能 够 容纳 无 穷 多 的 分 组 。 在 现实 中 ， 一 条 链 路 前 的 
队列 只 有 有 限 的 容量 ， 尽 管 排队 容量 极 大 地 依赖 于 路 由 器 设计 和 成 本 。 因 为 该 排队 容量 是 
有 限 的 ， 随 着 流量 强度 接近 1 ， 排 队 时 延 并 不 真正 趋同 无 穷 大 。 相 反 ， 到 达 的 分 组 将 发 现 
一 个 满 的 队列 。 由 于 没有 地 方 存储 这 个 分 组 ， 路 由 器 将 丢弃 (drop) 该 分 组 ， 即 该 分 组 将 
BERK (lost)。 当 流量 强度 大 于 1 时 ， 队 列 中 的 这 种 溢出 也 能 够 在 用 于 队列 的 Java 小 程序 
中 看 到 。 

从 端 系统 的 角度 看 ， 上 述 丢 包 现 象 看 起 来 是 一 个 分 组 已 经 传输 到 网 络 核心 ， 但 它 绝 不 
会 从 网 络 发 送 到 目的 地 。 分 组 丢失 的 比例 随 着 流量 强度 增加 而 增加 。 因 此 ， 一 个 节点 的 性 
能 常常 不 仅 根据 时 延 来 度量 ， 而 且 根据 丢 包 的 概率 来 度量 。 正 如 我 们 将 在 后 面 各 章 中 讨论 
的 那样 , 丢失 的 分 组 可 能 基于 端 到 端的 原则 重 传 ， 以 确保 所 有 的 数据 最 终 从 源 传送 到 了 目 
的 地 。 


1.4.3 端 到 端 时 延 


前 面 的 讨论 一 直 集 中 在 节点 时 延 上 ， 即 在 单 台 路 由 器 上 的 时 延 。 我 们 现在 考虑 从 源 到 
目的 地 的 总 时 延 。 为 了 能 够 理解 这 个 概念 ,假定 在 源 主机 和 目的 主机 之 间 有 NN -1 台 路 由 
器 。 我 们 还 要 假设 该 网 络 此 时 是 无 拥塞 的 (因此 排队 时 延 是 微不足道 的 ) ， 在 每 台 路 由 器 
和 源 主机 上 的 处 理 时 延 是 d;。， 每 台 路 由 器 和 源 主机 的 输出 速率 是 R bps， 每 条 链 路 的 传 
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播 时 延 是 ds。 节点 时 延 累加 起 来 ， 得 到 端 到 端 时 延 ; 

doada = NC dice Ed + Fprop ) (1-2) 
E, RP dons =LLR， 其 中 工 是 分 组 长 度 。 值 得 注意 的 是 , 式 (1-2) 是 式 (1-1) 的 一 
般 形式 , 式 (1-1) 没有 考虑 处 理 时 延 和 传播 时 延 。 在 各 节点 具有 不 同 的 时 延 和 每 个 节点 
存在 平均 排队 时 延 的 情况 下 ， 需 要 对 式 (1-2) 进行 一 般 化 处 理 。 我 们 将 有 关 工 作 留 给 
读者 。 

1. Traceroute 

为 了 对 计算 机 网 络 中 的 端 到 端 时 延 有 第 一 手 认 识 ， 我 们 可 以 利用 Traceroute 程序 。 
Traceroute 是 一 个 简单 的 程序 ， 它 能 够 在 任何 因特网 主机 上 运行 。 当 用 户 指 定 一 个 目的 主 
机 名 字 时 ， 源 主机 中 的 该 程序 朝 着 目的 地 发 送 多 个 特殊 的 分 组 。 当 这 些 分 组 向 着 目的 地 传 
送 时 ， 它 们 通过 一 系列 路 由 器 。 当 路 由 器 接收 到 这 些 特 殊 分 组 之 一 时 ， 它 向 源 回 送 一 个 短 
报 文 。 该 短 报 文 包括 路 由 器 的 名 字 和 地 址 。 

更 具体 的 是 ,假定 在 源 和 目的 地 之 间 有 NN -1 台 路 由 器 。 源 将 向 网 络 发 送 NN 个 特殊 的 
分 组 ， 其 中 每 个 分 组 地 址 指向 最 终 目的 地 。 这 六 个 特殊 分 组 标识 为 从 1 到 NN， 第 一 个 分 组 
标识 为 1， 最 后 的 分 组 标识 为 N HE n 台 路 由 器 接收 到 标识 为 n 的 第 个 分 组 时 ， 该 路 
由 器 不 是 向 它 的 目的 地 转发 该 分 组 ， 而 是 向 源 回 送 一 个 报 文 。 当 目的 主机 接收 第 N 个 分 组 
时 ， 它 也 会 癌 源 返 回 一 个 报 文 。 该 源 记录 了 从 它 发 送 一 个 分 组 到 它 接收 到 对 应 返回 报 文 所 
经 历 的 时 间 ; 它 也 记录 了 返回 该 报 文 的 路 由 器 (或 目的 主机 ) 的 名 字 和 地 址 。 以 这 种 方 
式 ， 源 能 够 重建 分 组 从 源 到 目的 地 所 采用 的 路 由 ， 并 且 该 源 能 够 确定 到 所 有 中 间 路 由 器 的 
往返 时 延 。Traceroute 实际 上 对 刚才 描述 的 实验 重复 了 3 次 ， 因 此 该 源 实 际 上 向 目的 地 发 
送 了 3 xN 个 分 组 。RFC 1393 详细 地 描述 了 Traceroute, 

这 里 有 一 个 Traceroute 程序 输出 的 例子 ， 其 中 追踪 的 路 由 从 源 主机 gaia. cs. umass. edu 
(位 于 马萨诸塞 大 学 ) 到 cis. poly. edu (位 于 布鲁克 林 的 理工 大 学 ) 。 输 出 有 6 列 : 第 一 列 
- 是 前 面 描述 的 值 ， 即 路 径 上 的 路 由 器 编号 ; 第 二 列 是 路 由 器 的 名 字 ; 第 三 列 是 路 由 器 地 
址 (格式 为 xxx. xxx. xxx. xxx); 最 后 3 列 是 3 次 实验 的 往返 时 延 。 如 果 源 从 任何 给 定 路 由 
器 接收 到 的 报 文 少 于 3 条 (由 于 网 络 中 的 丢 包 ) Traceroute 在 该 路 由 器 号 码 后 面 放 一 个 星 
号 ， 并 向 那 台 路 由 器 报告 少 于 3 次 往返 时 间 。 


cs-gw (128.119.240.254) 1:009 ms 0.899 ms 0.993 ms 

128.119.3,154 (128.119.3.154) 0.931 ms 0.441 ms 0.651 ms 
-border4-rt-gi-1-3.gw.umass.edu (128.119.2.194) 1.032 ms 0.484 ms 0.451 ms 
-acrl-ge-2-1-0.Boston.cw.net (208.172.51.129) 10.006 ms 8.150 ms 8.460 ms 
-dgr4-loopback.NewYork.cw.net (206.24.194.104) 12.272 ms 14.344 ms 13.267 ms 
-acr2-loopback.NewYork.cw.net (206.24.194.62) 13.225 ms 12.292 ms 12.148 ms 
—pos10-2.core2.NewYork1.Level3.net (209.244.160.133) 12.218 ms 11.823 ms 11.793 ms 
-gige9-1-52 .hsipaccess1 .NewYorkl.Level3.net (64.159.17.39) 13.081 ms 11.556 ms 13.297 ms 


o Nuy AURUDE 


Oo 


-p0-0.polyu.bbnplanet.net (4.25.109.122) 12.716 ms 13.052 ms 12.786 ms 
10 cis.poly.edu (128.238.32.126) 14.080 ms 13.035 ms 12.802 ms 


在 上 述 跟 踪 中 ,在 源 和 目的 之 间 有 9 台 路 由 器 。 这 些 路 由 器 中 的 多 数 有 一 个 名 字 ， 所 
有 都 有 地 址 。 例 如 ， 路 由 器 3 的 名 字 是 border4- rt- gi- 1-3. gw. umass. edu， 它 的 地 址 是 
128. 119. 2. 194。 看 看 为 这 人 台 路 由 器 提供 的 数据 ， 可 以 看 到 在 源 和 路 由 器 之 间 的 往返 时 延 : 
3 次 实验 中 的 第 一 次 是 1. 03ms， 后 继 两 次 实验 的 往返 时 延 是 0.48ms 和 0. 45ms。 这 些 往返 
时 延 包 括 刚才 讨论 的 所 有 时 延 ， 即 包括 传输 时 延 、 传 播 时 延 、 路 由 器 处 理 时 延 和 排队 时 
延 。 因 为 该 排队 时 延 随时 间 变 化 ， 所 以 分 组 发送 到 路 由 器 n 的 往返 时 延 实 际 上 可 能 比分 
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组 n+1 发 送 到 路 由 器 n+1 的 往返 时 延 更 长 。 的 确 ， 我 们 在 上 述 例子 中 观察 到 了 这 种 现象 : 
到 路 由 器 6 的 时 延 比 到 路 由 器 7 的 更 大 ! 

你 想 自 己 试 试 Traceroute 程序 吗 ? 我 们 极力 推荐 你 访问 http://www. traceroute. org, È 
的 Web 界面 提供 了 有 关 路 由 跟踪 的 大 量 源 列表 。 你 选择 一 个 源 ， 并 提供 任何 目的 地 的 主 
机 名 ， 该 Traceroute 程序 则 会 完成 所 有 工作 。 有 许多 为 Traceroute 提供 图 形 化 界面 的 免费 软 
件 ， 其 中 我 们 喜爱 的 一 个 程序 是 PingPlotter| PingPlotter 2016 | 。 

2， 端 系统 、 应 用 程序 和 其 他 时 延 

除了 处 理 时 延 、 传 输 时 延 和 传播 时 延 ， 端 系统 中 还 有 其 他 一 些 重要 时 延 。 例 如 ,和 希望 
向 共享 媒体 (例如 在 WiFi 或 电缆 调制 解 调 器 情况 下 ) 传输 分 组 的 端 系统 可 能 有 意 地 延迟 
它 的 传输 ， 把 这 作为 它 与 其 他 端 系统 共享 媒体 的 协议 的 一 部 分 ; 我 们 将 在 第 6 章 中 详细 地 
考虑 这 样 的 协议 。 另 一 个 重要 的 时 延 是 媒体 分 组 化 时 延 ， 这 种 时 延 出 现在 耳语 音 ( VoIP) 
应 用 中 。 在 VoIP 中 ， 发 送 方 在 向 因特网 传递 分 组 之 前 必须 首先 用 编码 的 数字 化 语音 填充 
一 个 分 组 。 这 种 填充 一 个 分 组 的 时 间 称 为 分 组 化 时 延 ， 它 可 能 较 大 ， 并 能 够 影响 用 户 感受 
到 的 VoIP 呼叫 的 质量 。 这 个 问题 将 在 本 章 结束 的 课 后 作业 中 进一步 探讨 。 


1.4.4 计算 机 网 络 中 的 吞吐 量 


除了 时 延 和 丢 包 ， 计 算 机 网 络 中 另 一 个 至 关 重 要 的 性 能 测度 是 端 到 端 吞 吐 量 。 为 了 定 
义 吞 吐 量 ， 考 虑 从 主机 A 到 主机 B 跨越 计算 机 网 络 传送 一 个 大 文件 。 例 如 ， 也 许 是 从 一 个 
P2P 文件 共享 系统 中 的 一 个 对 等 方向 另 一 个 对 等 方 传 送 一 个 大 视频 片段 。 在 任何 时 间 了 瞬间 
的 瞬时 吞吐 量 (instantaneous throughput) 是 主机 B 接收 到 该 文件 的 速率 (以 bps it). GF 
多 应 用 程序 包括 许多 PP 文件 共享 系统 ， 其 用 户 界面 显示 了 下 载 期 间 的 瞬时 吞吐 量 ， 也 许 
你 以 前 已 经 观察 过 它 !) 如 果 该 文件 由 下 比特 组 成 ， 主 机 B 接收 到 所 有 下 比特 用 去 7 了 秒 ， 
则 文件 传送 的 平均 吞吐 量 (average throughput) 是 F/T bps。 对 于 某 些 应 用 程序 如 因特网 电 
话 ， 希 望 具有 低 时 延 和 在 某 个 交 值 之 上 (例如 ， 对 某 些 因 特 网 电话 是 超过 24kbps， 对 某 些 
实时 视频 应 用 程序 是 超过 256kbps) 的 一 致 的 瞬时 吞吐 量 。 对 于 其 他 应 用 程序 ， 包 括 涉及 
文件 传送 的 那些 应 用 程序 ， 时 延 不 是 决定 性 的 ， 但 是 希望 具有 尽 可 能 高 的 吞吐 量 。 

为 了 进一步 深入 理解 和 春 吐 量 这 个 重要 概念 ， 我 们 考虑 几 个 例子 。 图 1-19a 显示 了 服务 
器 和 客户 这 两 个 端 系统 ， 它 们 由 两 条 通信 链 路 和 一 台 路 由 器 相连 。 考 虑 从 服务 器 传送 一 个 
文件 到 客户 的 吞吐 量 。 令 R, 表示 服务 器 与 路 由 器 之 间 的 链 路 速率 ; R, 表示 路 由 器 与 客户 
之 间 的 链 路 速率 。 假 定 在 整个 网 络 中 只 有 从 该 服务 器 到 客户 的 比特 在 传送 。 在 这 种 理想 的 
情况 下 ， 我 们 要 问 该 服务 器 到 客户 的 吞吐 量 是 多 少 ” 为 了 回答 这 个 问题 ， 我 们 可 以 想象 比 
特 是 流体 ， 通 信 链 路 是 管道 。 显 然 ， 这 台 服 务 器 不 能 以 快 于 R, bps 的 速率 通过 其 链 路 注 
入 比特 ; 这 台 路 由 器 也 不 能 以 快 于 R, bps 的 速率 转发 比特 。 如 果 R, < R,.， 则 在 给 定 的 知 
吐 量 R, bps 的 情况 下 ， 由 该 服务 器 注入 的 比特 将 顺畅 地 通过 路 由 器 “流动 "， 并 以 速率 
R, bps 到 达 客 户 。 另 一 方面 ， 如 果 R. < R,.， 则 该 路 由 器 将 不 能 像 接收 速率 那样 快 地 转发 
比特 。 在 这 种 情况 下， 比特 将 以 速率 R, 离开 该 路 由 器 ， 从 而 得 到 端 到 端 吞 吐 量 R.。 
(还 要 注意 的 是 ， 如 果 比 特 继续 以 速率 R 到 达 路 由 器 ， 继 续 以 R, 离开 路 由 器 的 话 ， 在 
该 路 由 器 中 等 待 传输 给 客户 的 积压 比特 将 不 断 增加 ， 这 是 一 种 最 不 希望 的 情况 !) 因此 ， 
对 于 这 种 简单 的 两 链 路 网 络 ， 其 吞吐 量 是 min | R, R), AREH, CE M 
(bottleneck link) 的 传输 速率 。 在 决定 了 吞吐 量 之 后 ,我 们 现在 近似 地 得 到 从 服务 器 到 
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Pe OF 比特 的 大 文件 所 需要 的 时 间 是 F/min| R.，R.| 。 举 一 个 特定 的 例子 ， 假 
定 你 正在 下 载 一 个 =32 x 10° 比特 的 MP3 文件 ， 服 务 器 具有 R, =2Mbps 的 传输 速率 ， 
并 且 你 有 一 条 R. =1Mbps 的 接 人 链 路 。 则 传输 该 文件 所 需 的 时 间 是 32 秒 。 当 然 ， 这 些 
吞吐 量 和 传输 时 间 的 表达 式 仅 是 近似 的 ， 因 为 它们 并 没有 考虑 存储 转发 、 处 理 时 延 和 协 
议 等 问题 。 





图 1-19 一 个 文件 从 服务 器 传送 到 客户 的 吞吐 量 


图 1-19b 此 时 显示 了 一 个 在 服务 器 和 客户 之 间 具 用 条 链 路 的 网 络 ， 这 NN 条 链 路 的 传 
输 速率 分 别 是 R，R,，…，Rn。 应 用 对 两 条 链 路 网 络 的 分 析 方 法 ,我 们 发 现 从 服务 器 到 
客户 的 文件 传输 吞吐 量 是 min| RI/，R;,，…，Rw| ， 这 同样 仍 是 沿 着 服务 器 和 客户 之 间 路 径 
的 瓶颈 链 路 的 速率 。 

现在 考虑 由 当前 因特网 所 引发 的 另 一 个 例子 。 图 1-20a 显示 了 与 一 个 计算 机 网 络 相连 
的 两 个 端 系统 : 一 台 服 务 器 和 一 个 客户 。 考 虑 从 服务 器 向 客户 传送 一 个 文件 的 吞吐 量 。 服 
务 器 以 速率 为 R, 的 接 人 链 路 与 网 络 相连 ， 且 客户 以 速率 为 尺 . 的 接 人 链 路 与 网 络 相连 。 现 
在 假定 在 通信 网 络 核心 中 的 所 有 链 路 具有 非常 高 的 传输 速率 ， 即 该 速率 比 R, 和 R, 要 高 得 
多 。 目 前 因特网 的 核心 的 确 超 量 配 置 了 高 速率 的 链 路 ， 从 而 很 少 出 现 拥 塞 。 同 时 假定 在 整 
个 网 络 中 发 送 的 比特 都 是 从 该 服务 器 到 该 客户 。 在 这 个 例子 中 ， 因 为 计算 机 网 络 的 核心 就 
像 一 个 粗大 的 管子 ， 所 以 比特 从 源 向 目的 地 的 流动 速率 仍 是 R, M R 中 的 最 小 者 ， 即 吞吐 
量 =min|R.，R.}。 因 此 ， 在 今天 因特网 中 对 吞吐 量 的 限制 因素 通常 是 接 入 网 。 

作为 最 后 一 个 例子 ， 考 虑 图 1-20b， 其 中 有 10 台 服 务 器 和 10 个 客户 与 某 计 算 机 网 络 
核心 相连 。 在 这 个 例子 中 ， 同 时 发 生 10 个 下 载 ， 涉 及 10 个 客户 - 服务 器 对 。 假 定 这 10 
个 下 载 是 网 络 中 当时 的 唯一 流量 。 如 该 图 所 示 ， 在 核心 中 有 一 条 所 有 10 个 下 载 通过 的 链 
路 。 将 这 条 链 路 R 的 传输 速率 表示 为 R。 假 定 所 有 服务 器 接 入 链 路 具有 相同 的 速率 R.,， 所 
有 客户 接 入 链 路 具有 相同 的 速率 R.， 并 且 核 心中 除了 速率 为 R 的 一 条 共同 链 路 之 外 的 所 
有 链 路 ， 它 们 的 传输 速率 都 比 R.、R. 和 RR 大 得 多 。 现 在 我 们 要 问 ， 这 种 下 载 的 吞吐 量 是 
多 少 ? 显然 ， 如 果 该 公共 链 路 的 速率 尺 很 大 ， 比 如 说 比 R, AR, 大 100 倍 ， 则 每 个 下 载 的 
吞吐 量 将 仍然 是 min| R,.，R.| 。 但 是 如 果 该 公共 链 路 的 速率 与 R, AR, 有 相同 量 级 会 怎样 
We? 在 这 种 情况 下 其 吞吐 量 将 是 多 少 呢 ?” 让 我 们 观察 一 个 特定 的 例子 。 假 定 R. =2Mbps， 
R. =1Mbps，R=5Mbps， 并且 公共 链 路 为 10 个 下 载 平 等 划分 它 的 传输 速率 。 这 时 每 个 下 
载 的 瓶颈 不 再 位 于 接 人 网 中 ， 而 是 位 于 核心 中 的 共享 链 路 了 ， 该 瓶颈 仅 能 为 每 个 下 载 提供 
500kbps 的 吞吐 量 。 因 此 每 个 下 载 的 端 到 端 吞 吐 量 现在 减少 到 500kbps。 





10 个 服务 器 





10 个 客户 
a) 客户 从 服务 器 下 载 一 个 文件 b) 10 个 客户 从 10 个 服务 器 下 载 文件 
图 1-20” 端 到 端 吞吐 量 


图 1-19 和 图 1-20 中 的 例子 说 明知 吐 量 取决 于 数据 流 过 的 链 路 的 传输 速率 。 我 们 看 到 
当 没 有 其 他 干扰 流量 时 ， 其 吞吐 量 能 够 近似 为 沿 着 源 和 目的 地 之 间 路 径 的 最 小 传输 速率 。 
图 1-20b 中 的 例子 更 一 般 地 说 明了 吞吐 量 不 仅 取决 于 沿 着 路 径 的 传输 速率 ， 而 且 取决 于 二 
扰 流 量 。 特 别 是 ， 如 果 许 多 其 他 的 数据 流 也 通过 这 条 链 路 流动 ， 一 条 具有 高 传输 速率 的 链 
路 仍然 可 能 成 为 文件 传输 的 瓶颈 链 路 。 我 们 将 在 课 后 习题 中 和 后 继 章 节 中 更 仔细 地 研究 计 
算 机 网 络 中 的 吞吐 量 。 | 


1.5 协议 层次 及 其 服务 模型 


从 我 们 到 目前 的 讨论 来 看 ， 因 特 网 显然 是 一 个 极为 复杂 的 系统 。 我 们 已 经 看 到 ， 因 特 
网 有 许多 部 分 : 大量 的 应 用 程序 和 协议 、 各 种 类 型 的 端 系 统 、 分 组 交换 机 以 及 各 种 类 型 的 
链 路 级 媒体 。 面 对 这 种 巨大 的 复杂 性 ， 存 在 着 组 织 网 络 体系 结构 的 希望 吗 ? 或 者 至 少 存在 
着 我 们 对 网 络 体系 结构 进行 讨论 的 希望 吗 ? 幸运 的 是 ， 对 这 两 个 问题 的 回答 都 是 肯定 的 。 


1.5.1 分 层 的 体系 结构 


在 试图 组 织 我 们 关于 因特网 体系 结构 的 想法 之 前 ， 先 看 一 个 人 类 社会 与 之 类 比 的 例 
子 。 实 际 上 ， 在 日 常生 活 中 我 们 一 直 都 与 复杂 系统 打交道 。 想 象 一 下 有 人 请 你 描述 比如 航 
线 系统 的 情况 吧 。 你 怎样 用 一 个 结构 来 描述 这 样 一 个 复杂 的 系统 ? 该 系统 具有 票务 代理 、 
行李 检查 、 登 机 口 人 员 、 飞 行 员 、 飞 机 、 空 中 航行 控制 和 世界 范围 的 导航 系统 。 描 述 这 种 
系统 的 一 种 方式 是 ,描述 当 你 乘 某 个 航班 时 ,你 (或 其 他 人 蔡 你 ) 要 采取 的 一 系列 动作 。 
你 要 购买 机 票 ， 托 运行 李 ， 去 登 机 口 ， 并 最 终 登 上 这 次 航班 。 该 飞机 起 飞 ， 飞 行 到 目的 
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地 。 当 飞机 着 陆 后 ， 你 从 登 机 口 离 机 并 认领 行李 。 如 果 这 次 行程 不 理想 ， 你 向 票务 机 构 投 
诉 这 次 航班 (你 的 努力 一 无 所 获 ) 。 图 1-21 显示 了 相关 情况 。 

我 们 已 经 能 从 这 里 看 出 与 计算 机 网 络 的 
某 些 类 似 : 航空 公司 把 你 从 源 送 到 目的 地 ; 
而 分 组 被 从 因特网 中 的 源 主机 送 到 目的 主 
机 。 但 这 不 是 我 们 寻求 的 完全 的 类 似 。 我 们 
在 图 1-21 中 寻找 某 些 结构 。 观 察 图 1-21， 我 
们 注意 到 在 每 一 端 都 有 票务 功能 ; 还 对 已 经 
检票 的 乘客 有 托运 行李 功能 ， 对 已 经 检票 并 
已 经 检查 过 行李 的 乘客 有 登 机 功能 。 对 于 那 
些 已 经 通过 登 机 口 的 乘客 〈 即 已 经 经 过 检 
票 、 行 李 检 查 和 通过 登 机 口 的 乘客 ) ， 有 起 
飞 和 着 陆 的 功能 ， 并 且 在 飞行 中 ， 有 飞机 按 
预定 路 线 飞 行 的 功能 。 这 提示 我 们 能 够 以 水 
平 的 方式 看 待 这些 功 能 ， 如 图 1-22 所 示 。 图 1-21 乘 飞机 旅行 的 一 系列 动作 

图 1-22 将 航线 功能 划分 为 一 些 层次 ， 提 供 了 我 们 能 够 讨论 航线 旅行 的 框架 。 注 意 到 
每 个 层次 与 其 下 面 的 层次 结合 在 一 起 ， 实 现 了 某 些 功能 、 服 务 。 在 票务 层 及 以 下 ， 完 成 了 
一 个 人 从 航线 柜台 到 航线 柜台 的 转移 。 在 行李 层 及 以 下 ， 完 成 了 人 和 行李 从 行李 托运 到 行 
李 认 领 的 转移 。 注 意 到 行李 层 仅 对 已 经 完成 票务 的 人 提供 服务 。 在 登 机 口 层 ， 完 成 了 人 和 
行李 从 离 港 登 机 口 到 到 港 登 机 口 的 转移 。 在 起 飞 /着 陆 层 ， 完 成 了 一 个 人 和 手提 行李 从 跑 
道 到 跑道 的 转移 。 每 个 层次 通过 以 下 方式 提供 服务 ; @ 在 这 层 中 执行 了 某 些 动作 〈 例 如 ， 
在 登 机 口 层 ， 某 飞机 的 乘客 登 机 和 离 机 ) ; @@ 使 用 直接 下 层 的 服务 〈 例 如 ， 在 登 机 口 层 ， 
使 用 起 飞 /着 陆 层 的 跑道 到 跑道 的 旅客 转移 服务 ) 。 









Be at 7 Set | x 4 . 线 - 和 F = M 
离开 机 场 中 间 空 中 交通 控制 中 心 到 达 机 场 
1-22 航线 功能 的 水 平分 层 


利用 分 层 的 体系 结构 ， 我 们 可 以 讨论 一 个 大 而 复杂 系统 的 定义 良好 的 特定 部 分 。 这 种 
简化 本 身 由 于 提供 模块 化 而 具有 很 高 价值 ， 这 使 某 层 所 提供 的 服务 实现 易于 改变 。 只 要 该 
层 对 其 上 面 的 层 提 供 相 同 的 服务 ， 并 且 使 用 来 自 下 面 层 次 的 相同 服务 ， 当 某 层 的 实现 变化 
时 ， 该 系统 的 其 余部 分 保持 不 变 。( 注意 到 改变 一 个 服务 的 实现 与 改变 服务 本 身 是 极为 不 
同 的 !) 例如 ， 如 果 登 机 口 功能 被 改变 了 (例如 让 人 们 按 身高 登 机 和 离 机 )， 航 线 系统 的 
其 余部 分 将 保持 不 变 ， 因 为 登 机 口 仍 然 提 供 相同 的 功能 (人 们 登 机 和 离 机 ); 改变 后 ， 它 
仅 是 以 不 同 的 方式 实现 了 该 功能 。 对 于 大 而 复杂 且 需 要 不 断 更 新 的 系统 ， 改 变 服务 的 实现 
而 不 影响 该 系统 其 他 组 件 是 分 层 的 另 一 个 重要 优点 。 
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1. 协议 分 层 

我 们 对 航线 已 经 进行 了 充分 讨论 ， 现 将 注意 力 转向 网 络 协议 。 为 了 给 网 络 协议 的 设计 
提供 一 个 结构 ， 网 络 设计 者 以 分 层 (layer) 的 方式 组 织 协议 以 及 实现 这 些 协议 的 网 络 硬件 
和 软件 。 每 个 协议 属于 这 些 层 次 之 一 ， 就 像 图 1-22 所 示 的 航线 体系 结构 中 的 每 种 功能 属 
于 某 一 层 一 样 。 我 们 再 次 关注 某 层 向 它 的 上 一 层 提 供 的 服务 (service), ， 即 所 谓 一 层 的 服 
务 模型 (service model) 。 就 像 前 面 航线 例子 中 的 情况 一 样 ， 每 层 通过 在 该 层 中 执行 某 些 动 
作 或 使 用 直接 下 层 的 服务 来 提供 服务 。 例 如 ， 由 第 n 层 提供 的 服务 可 能 包括 报 文 从 网 络 的 
一 边 到 另 一 边 的 可 靠 交 付 。 这 可 能 是 通过 使 有 第” — 1 层 的 边缘 到 边缘 的 不 可 靠 报 文 传送 
服务 ， 加 上 第 nn 层 的 检测 和 重 传 丢失 报 文 的 功能 来 实现 的 。 

一 个 协议 层 能 够 用 软件 、 硬 件 或 两 者 的 结合 来 实现 。 诸 如 HTTP 和 SMTP 这 样 的 应 用 

层 协议 几乎 总 是 在 端 系统 中 用 软件 实现 ， 运 输 层 协议 也 是 如 此 。 因 为 物理 层 和 数据 链 路 层 
负责 处 理 跨越 特定 链 路 的 通信 ， 它 们 通常 在 与 给 定 链 路 相关 联 的 网 络 接口 卡 〈 例 如 以 太 网 
或 WiFi 接口 卡 ) 中 实现 。 网 络 层 经 常 是 硬件 和 软件 实现 的 混合 体 。 还 要 注意 的 是 ， 如 同 
分 层 的 航线 体系 结构 中 的 功能 分 布 在 构成 该 系统 的 各 机 场 和 飞行 控制 中 心中 一 样 ， 一 个 第 
n 层 协 议 也 分 布 在 构成 该 网 络 的 端 系统 、 分 组 交换 机 和 其 他 组 件 中 。 这 就 是 说 ,第 n 层 协 
议 的 不 同 部 分 常常 位 于 这 些 网 络 组 件 的 各 部 分 中 。 

协议 分 层 具 有 概念 化 和 结构 化 的 优点 [RFC 3439] 。 如 我 们 看 到 的 那样 ， 分 层 提供 了 
一 种 结构 化 方式 来 讨论 系统 组 件 。 模 块 化 使 更 新 系统 组 件 更 为 容易 。 然 而 ， 需 要 提 及 的 
是 ， 某 些 研 究 人 员 和 联网 工程 师 激烈 地 反对 分 层 [Wakeman 1992 ] 。 分 层 的 一 个 潜在 缺点 
是 一 层 可 能 元 余 较 低 层 的 功能 。 例 如 ， 许 多 协议 栈 在 基于 每 段 链 路 和 基于 端 到 端 两 种 情况 
下 ， 都 提供 了 差错 恢复 。 第 二 种 潜在 的 缺点 是 某 层 的 功能 可 能 需要 仅 在 其 他 某 层 才 出 现 的 
信息 (MTB), ， 这 违反 了 层次 分 离 的 目标 。 

将 这 些 综合 起 来 ， 各 层 的 所 有 协议 被 称 为 协议 栈 (protocol stack) 。 因 特 网 的 协议 栈 由 
5 个 层次 组 成 : 物理 层 、 链 路 层 、 网 络 层 、 运 输 层 和 应 用 层 ( 如 图 1-23a 所 示 ) 。 如 果 你 查 
看 本 书目 录 ， 将 会 发 现 我 们 大 致 是 以 因特网 协议 栈 的 层次 来 组 织 本 书 的 。 我 们 采用 了 自 项 
向 下 方法 (top-down approach) ， 首 先 处 理应 用 层 ， 然 后 向 下 进行 处 理 。 

(1) 应 用 层 

应 用 层 是 网 络 应 用 程序 及 它们 的 应 用 层 协 
议 存 留 的 地 方 。 因 特 网 的 应 用 层 包括 许多 协 
议 , 例如 HTTP (ERT Web 文档 的 请 求 和 
传送 )、SMTP ( 它 提供 了 电子 邮件 报 文 的 传 
H) 和 FIP ( 它 提供 两 个 端 系统 之 间 的 文件 传 
送 ) 。 我 们 将 看 到 ， 某 些 网 络 功能 ， 如 将 像 
www. ietf. org 这 样 对 人 友好 的 端 系统 名 字 转 换 
为 32 比特 的 网 络 地 址 ， 也 是 借助 于 特定 的 应 
用 层 协议 即 域名 系统 (DNS) SERA. FAT a) 5 层 因特网 协议 配 b) 7 层 ISO OSI 参考 模型 
在 第 2 章 中 看 到 ， 创 建 并 部 署 我 们 自己 的 新 应 图 1-23 因特网 协议 栈 和 OSI 参考 模型 
用 层 协议 是 非常 容易 的 。 

应 用 层 协议 分 布 在 多 个 端 系统 上 ， 而 一 个 端 系统 中 的 应 用 程序 使 用 协议 与 另 一 个 端 系统 
中 的 应 用 程序 交换 信息 分 组 。 我 们 把 这 种 位 于 应 用 层 的 信息 分 组 称 为 报 文 (message) 。 
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(2) 运输 层 

因特网 的 运输 层 在 应 用 程序 端点 之 间 传 送 应 用 层 报 文 。 在 因特网 中 ， 有 两 种 运输 协 
议 ， 即 TCP 和 UDP， 利 用 其 中 的 任 一 个 都 能 运输 应 用 层 报 文 。TCP 向 它 的 应 用 程序 提供 了 
面向 连接 的 服务 。 这 种 服务 包括 了 应 用 层 报 文 向 目的 地 的 确保 传递 和 流量 控制 〈 即 发 送 
方 /接收 方 速率 匹配 ) 。TCP 也 将 长 报 文 划分 为 短 报 文 ， 并 提供 拥塞 控制 机 制 ， 因 此 当 网 络 
拥塞 时 ， 源 抑制 其 传输 速率 。UDP 协议 向 它 的 应 用 程序 提供 无 连接 服务 。 这 是 一 种 不 提供 
不 必要 服务 的 服务 ， 没 有 可 靠 性 ， 没 有 流量 控制 ， 也 没有 拥塞 控制 。 在 本 书 中 , 我 们 把 运 
输 层 的 分 组 称 为 报 文 段 (segment) 。 

(3) 网 络 层 

因特网 的 网 络 层 负责 将 称 为 数据 报 (datagram) 的 网 络 层 分 组 从 一 台 主 机 移动 到 另 一 
台 主 机 。 在 一 台 源 主机 中 的 因特网 运输 层 协议 (TCP 或 UDP) 向 网 络 层 递交 运输 层 报 文 段 
和 目的 地 址 ， 就 像 你 通过 邮政 服务 寄 信件 时 提供 一 个 目的 地 址 一 样 s 

因特网 的 网 络 层 包括 著名 的 网 际 协议 下， 该 协议 定义 了 在 数据 报 中 的 各 个 字段 以 及 端 
系统 和 路 由 器 如 何 作用 于 这 些 字 段 。IP 仅 有 一 个 ， 所 有 具有 网 络 层 的 因特网 组 件 必须 运行 
IP。 因特网 的 网 络 层 也 包括 决定 路 由 的 路 由 选择 协议 ， 它 根据 该 路 由 将 数据 报 从 源 传输 到 
目的 地 。 因 特 网 具有 许多 路 由 选择 协议 。 如 我 们 在 1.3 节 所 见 ， 因 特 网 是 一 个 网 络 的 网 
络 ， 并 且 在 一 个 网 络 中 ， 其 网 络 管理 者 能 够 运行 所 希望 的 任何 路 由 选择 协议 。 尽 管 网 络 层 
包括 了 网 际 协议 和 一 些 路 由 选择 协议 , 但 通常 把 它 简 单 地 称 为 PP 层 ， 这 反映 了 IP 是 将 因 
特 网 连接 在 一 起 的 黏合 剂 这 样 的 事实 。 

(4) 链 路 层 

因特网 的 网 络 层 通过 源 和 目的 地 之 间 的 一 系列 路 由 器 路 由 数据 报 。 为 了 将 分 组 从 一 个 
节点 (主机 或 路 由 器 ) 移动 到 路 径 上 的 下 一 个 节点 ， 网 络 层 必须 依靠 该 链 路 层 的 服务 。 特 
别 是 在 每 个 节点 ， 网 络 层 将 数据 报 下 传 给 链 路 层 ， 链 路 层 沿 着 路 径 将 数据 报 传递 给 下 一 个 
- 节点 。 在 该 下 一 个 节点 ， 链 路 层 将 数据 报 上 传 给 网 络 层 。 

由 链 路 层 提供 的 服务 取决 于 应 用 于 该 链 路 的 特定 链 路 层 协 议 。 例 如 ， 某 些 协 议 基 于 链 
路 提供 可 靠 传递 ， 从 传输 节点 跨越 一 条 链 路 到 接收 节点 。 值 得 注意 的 是 ,， 这 种 可 靠 的 传递 
服务 不 同 于 TCP 的 可 靠 传递 服务 ，TCP 提供 从 一 个 端 系统 到 男 一 个 端 系统 的 可 靠 交 付 。 链 
路 层 的 例子 包括 以 太 网 、WiFi 和 电缆 接 入 网 的 DOCSIS 协议 。 因 为 数据 报 从 源 到 目的 地 传 
送 通常 需要 经 过 几 条 链 路 ， 一 个 数据 报 可 能 被 沿途 不 同 链 路 上 的 不 同 链 路 层 协 议 处 理 。 例 
如 ， 一 个 数据 报 可 能 被 一 段 链 路 上 的 以 太 网 和 下 一 段 链 路 上 的 PPP 所 处 理 。 网 络 层 将 受到 
来 自 每 个 不 同 的 链 路 层 协议 的 不 同 服务 。 在 本 书 中 ， 我 们 把 链 路 层 分 组 称 为 帧 〈frame) 。 

(5) 物理 层 

虽然 链 路 层 的 任务 是 将 整个 帧 从 一 个 网 络 元 素 移 动 到 邻近 的 网 络 元 素 ， 而 物理 层 的 任务 
是 将 该 帧 中 的 一 个 个 比特 从 一 个 节点 移动 到 下 一 个 节点 。 在 这 层 中 的 协议 仍然 是 链 路 相关 
的 ， 并 且 进 一 步 与 该 链 路 〈 例 如 ， 双 绞 铜 线 、 单 模 光 纤 ) 的 实际 传输 媒体 相关 。 例 如 ， 以 太 
网 具有 许多 物理 层 协议 : 一 个 是 关于 双 绞 铜 线 的 ， 男 一 个 是 关于 同 轴 电 缆 的 ， 还 有 一 个 是 关 
于 光纤 的 ， 等 等 。 在 每 种 场合 中 ， 跨 越 这 些 链 路 移动 一 个 比特 是 以 不 同 的 方式 进行 的 。 

2. OSI 模型 


详细 地 讨论 过 因特网 协议 栈 后 ， 我 们 应 当 提 及 它 不 是 唯一 的 协议 栈 。 特 别 是 在 20 世 
纪 70 年代 后 期 ， 国 际 标准 化 组 织 (ISO) 提出 计算 机 网 络 围绕 7 层 来 组 织 ， 称 为 开放 系统 
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互 连 (OSI) 模型 [ISO 2016] 。 当 那些 要 成 为 因特网 协议 的 协议 还 处 于 袜 宰 之 中 ， 只 是 许 
多 正在 研发 的 不 同 协议 族 之 一 时 ，0SI 模型 就 已 经 成 形 。 事 实 上 ,初始 OSI 模型 的 发 明 者 
在 创建 该 模型 时 心中 可 能 并 没有 想到 因特网 。 无 论 如 何 ， 自 20 世纪 70 年 代 后 期 开始 ， 许 
多 培训 课程 和 大 学 课程 都 围绕 7 层 模型 挑选 有 关 ISO 授权 和 组 织 的 课程 。 因 为 它 在 网 络 教 
育 的 早期 影响 ,该 7 层 模 型 继续 以 某 种 方式 存留 在 某 些 网 络 教科 书 和 培训 课程 中 。 

显示 在 图 1-23b 中 的 OSI 参考 模型 的 7 层 是 : 应 用 层 、 表 示 层 、 会 话 层 、 运 输 层 、 网 
络 层 、 数 据 链 路 层 和 物理 层 。 这 些 层次 中 ，5 层 的 功能 大 致 与 它们 名 字 类 似 的 因特网 对 应 
层 的 功能 相同 。 所 以 ， 我 们 来 考虑 O 参考 模型 中 附加 的 两 个 屋 ， 即 表示 层 和 会 话 层 。 表 
示 层 的 作用 是 使 通信 的 应 用 程序 能 够 解释 交换 数据 的 含义 。 这 些 服务 包括 数据 压缩 和 数据 
加 密 (它们 是 自 解释 的 ) 以 及 数据 描述 (这 使 得 应 用 程序 不 必 担 心 在 各 台 计 算 机 中 表示 / 
存储 的 内 部 格式 不 同 的 问题 )。 会 话 层 提供 了 数据 交换 的 定 界 和 同步 功能 ， 包 括 了 建立 检 
查 点 和 恢复 方案 的 方法 。 

因特网 缺少 了 在 0SI 参考 模型 中 建立 的 两 个 层次 ,该 事实 引起 了 一 些 有 趣 的 问题 : 
这 些 层次 提供 的 服务 不 重要 吗 ? 如 果 一 个 应 用 程序 需要 这 些 服务 之 一 ， 将 会 怎样 呢 ? A 
特 网 对 这 两 个 问题 的 回答 是 相同 的 : 这 留 给 应 用 程序 开发 者 处 理 。 应 用 程序 开发 者 决定 
一 个 服务 是 否 是 重要 的 ， 如 果 该 服务 重要 ， 应 用 程序 开发 者 就 应 该 在 应 用 程序 中 构建 该 
功能 。 


1.5.2 封装 


图 1-24 显示 了 这 样 一 条 物理 路 径 : 数据 从 发 送 端 系统 的 协议 栈 向 下 ， 沿 着 中 间 的 链 
路 层 交 换 机 和 路 由 器 的 协议 栈 上 上 下 下 ， 然 后 向 上 到 达 接 收 端 系统 的 协议 栈 。 如 我 们 将 在 
本 书后 面 讨 论 的 那样 ， 路 由 器 和 链 路 层 交 换 机 都 是 分 组 交换 机 。 与 端 系统 类 似 ， 路 由 器 和 
链 路 层 交 换 机 以 多 层次 的 方式 组 织 它 们 的 网 络 硬 件 和 软件 。 而 路 由 器 和 链 路 层 交 换 机 并 不 
实现 协议 栈 中 的 所 有 层次 。 如 图 1-24 所 示 ， 链 路 层 交 换 机 实现 了 第 一 层 和 第 二 层 ; 路 由 
器 实现 了 第 一 层 到 第 三 层 。 例 如 ， 这 意味 着 因特网 路 由 器 能 够 实现 他 协议 (一 种 第 三 层 
协议 ) ， 而 链 路 层 交 换 机 则 不 能 。 我 们 将 在 后 面 看 到 ， 尽 管 链 路 层 交 换 机 不 能 识别 IP 地 
址 ， 但 它们 能 够 识别 第 二 层 地 址 ， 如 以 太 网 地 址 。 值 得 注意 的 是 ， 主 机 实现 了 所 有 5 个 层 
次 ， 这 与 因特网 体系 结构 将 它 的 复杂 性 放 在 网 络 边缘 的 观点 是 一 致 的 。 

图 1-24 也 说 明了 一 个 重要 概念 : 封装 ( encapsulation ) 。 在 发 送 主机 端 ， 一 个 应 用 层 
报 文 (application-layer message) (图 1-24 中 的 M) 被 传送 给 运输 层 。 在 最 简单 的 情况 下 ， 
运输 层 收 取 到 报 文 并 附 上 附加 信息 (所 谓 运 输 层 首部 信息 ， 图 1-24 中 的 再 ) ， 该 首部 将 被 
接收 端的 运输 层 使 用 。 应 用 层 报 文 和 运输 层 首部 信息 一 道 构 成 了 运输 层 报 文 段 (transport- 
layer segment) 。 运 输 层 报 文 段 因 此 封装 了 应 用 层 报 文 。 附 加 的 信息 也 许 包 括 了 下 列 信息 : 
允许 接收 端 运输 层 向 上 向 适当 的 应 用 程序 交付 报 文 的 信息 ; 差错 检测 位 信息 ， 该 信息 让 接 
收 方 能 够 判断 报 文中 的 比特 是 否 在 途中 已 被 改变 。 运 输 层 则 向 网 络 层 传 递 该 报 文 段 ， 网 络 
层 增 加 了 如 源 和 目的 端 系统 地 址 等 网 络 层 首部 信息 (图 1-24 中 的 HH,)， 生 成 了 网 络 层 数 
据 报 (network-layer datagram) 。 该 数据 报 接 下 来 被 传递 给 链 路 层 ， 链 路 层 “〈 自 然而 然 地 ) 
增加 它 自 己 的 链 路 层 首 部 信息 并 生成 链 路 层 帧 〈link-layer frame) 。 所 以 我 们 看 到 ， 在 每 一 
层 ， 一 个 分 组 具有 两 种 类 型 的 字段 : 首部 字段 和 有 效 载荷 字段 (payload field) 。 有 效 载荷 
通常 是 来 自 上 一 层 的 分 组 。 
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图 1-24 主机 、 路 由 器 和 链 路 层 交 换 机 ， 每 个 包含 了 不 同 的 层 ， 反 映 了 它们 的 功能 差异 


这 里 一 个 有 用 的 类 比 是 经 过 公共 邮政 服务 在 某 公 司 办 事 处 之 间 发 送 一 封 备忘录 。 假 定 
位 于 某 办 事 处 的 Alice 要 向 位 于 另 一 办 事 处 的 Bob 发 送 一 封 备忘录 。 该 备忘录 类 比 于 应 用 
层 报 文 。Alice 将 备忘录 放 人 人 办事 处 之 间 的 公函 信封 中 ， 并 在 公函 信封 上 方 写 上 了 Bob 的 
名 字 和 部 门 。 该 办 事 处 之 间 的 公函 信封 类 比 于 运输 层 报 文 段 ， 即 它 包 括 了 首部 信息 (Bob 
的 名 字 和 部 门 编号 ) 并 封装 了 应 用 层 报 文 (备忘录 ) 。 当 发 送 办 事 处 的 收发 室 拿 到 该 办 事 
处 之 间 的 备忘录 时 ， 将 其 放 人 适合 在 公共 邮政 服务 发 送 的 信封 中 ， 并 在 邮政 信封 上 写 上 发 
送 和 接收 办 事 处 的 邮政 地 址 。 此 处 ， 邮 政信 封 类 比 于 数据 报 ， 它 封装 了 运输 层 的 报 文 段 
(办 事 处 之 间 的 公函 信封 ) ， 该 报 文 段 封装 了 初始 报 文 (备忘录 )。 邮 政 服务 将 该 邮政 信封 
交付 给 接收 办 事 处 的 收发 室 。 在 此 处 开始 了 拆 封 过 程 。 该 收发 室 取出 了 办 事 处 之 间 的 公函 
信封 并 转发 给 Bob, Ha, Bob 打开 信封 并 拿 走 了 备忘录 。 

封装 的 过 程 能 够 比 前 面 描述 的 更 为 复杂 。 例 如 ， 一 个 大 报 文 可 能 被 划分 为 多 个 运输 层 
的 报 文 段 (这 些 报 文 段 每 个 可 能 被 划分 为 多 个 网 络 层 数 据 报 ) 。 在 接收 端 ， 则 必须 从 其 连 
续 的 数据 报 中 重 构 这 样 一 个 报 文 段 。 


1.6 面 对 攻 击 的 网 络 


对 于 今天 的 许多 机 构 (包括 大 大 小 小 的 公司 、 大 学 和 政府 机 关 ) 而 言 ， 因 特 网 已 经 成 为 
与 其 使 命 密切 相关 的 一 部 分 了 。 许 多 人 也 依赖 因特网 从 事 各 种 职业 、 社 会 和 个 人 活动 。 目 
前 ， 数 以 亿 计 的 物品 〈 包 括 可 穿戴 设备 和 家 用 设备 ) 与 因特网 相连 。 但 是 在 所 有 这 一 切 背 
后 ， 存 在 着 一 个 阴暗 面 ， 其 中 的 “ 坏 家 伙 ” 试 图 对 我 们 的 日 常生 活 进行 破坏 ， 如 损坏 我 们 与 
因特网 相连 的 计算 机 ， 侵 犯 我 们 的 隐私 以 及 使 我 们 依赖 的 因特网 服务 无 法 运行 。 





网 络 安全 领域 主要 探讨 以 下 问题 : 坏 家 伙 如 何 攻 击 计 算 机 网 络 ， 以 及 我 们 〈 即 将 成 为 
计算 机 网 络 的 专家 ) 如 何 防御 以 免 受 他 们 的 攻击 ， 或 者 更 好 的 是 设计 能 够 事先 免除 这 样 的 
攻击 的 新 型 体系 结构 。 面 对 经 常 发 生 的 各 种 各 样 的 现 有 攻击 以 及 新 型 和 更 具 摧 毁 性 的 未 来 
攻击 的 威胁 ， 网 络 安全 已 经 成 为 近年 来 计算 机 网 络 领域 的 中 心 主 题 。 本 书 的 特色 之 一 是 将 
网 络 安全 问题 放 在 中 心 位 置 。 

因为 我 们 在 计算 机 网 络 和 因特网 协议 方面 还 没有 专业 知识 ， 所 以 这 里 我 们 将 从 审视 某 
些 今 天 最 为 流行 的 与 安全 性 相关 的 问题 开始 。 这 将 刺激 我 们 的 胃口 ， 以 便 我 们 在 后 续 章 节 
中 进行 更 为 充实 的 讨论 。 我 们 在 这 里 以 提出 问题 开始 : 什么 会 出 现 问题 ? 计算 机 网 络 是 如 
何 受到 攻击 的 ? 今天 一 些 最 为 流行 的 攻击 类 型 是 什么 ? 

1. 坏 家 伙 能 够 经 因特网 将 有 害 程 序 放 人 你 的 计算 机 中 

因为 我 们 要 从 /向 因特网 接收 /发 送 数据 ， 所 以 我 们 将 设备 与 因特网 相连 。 这 包括 各 种 
好 东西 ， 例 如 Instagram 帖子 、 因 特 网 搜索 结果 、 流 式 音乐 、 视 频 会 议 、 流 式 电影 等 。 但 
不 幸 的 是 ,伴随 好 的 东西 而 来 的 还 有 恶意 的 东西 ， 这 些 恶 意 的 东西 可 统称 为 恶意 软件 
(malware) ， 它 们 能 够 进入 并 感染 我 们 的 设备 。 一 旦 恶意 软件 感染 我 们 的 设备 ， 就 能 够 做 
各 种 不 正当 的 事情 ， 包 括 删除 我 们 的 文件 ， 安 装 间谍 软件 来 收集 我 们 的 隐私 信息 ， 如 社会 
保险 号 、 口 令 和 击 键 ， 然 后 将 这 些 ( 当然 经 因特网 ) 发 送 给 坏 家 伙 。 我 们 的 受害 主机 也 可 
能 成 为 数 以 千 计 的 类 似 受 害 设 备 网 络 中 的 一 员 ， 它 们 被 统称 为 僵尸 网 络 (botnet) ， 坏 家 伙 
利用 僵尸 网 络 控制 并 有 效 地 对 目标 主机 展开 垃圾 邮件 分 发 或 分 布 式 拒 绝 服务 攻击 〈 很 快 将 
讨论 ) 。 

至 今 为 止 的 多 数 恶意 软件 是 自我 复制 〈self- replicating) 的 : 一 旦 它 感 染 了 一 台 主 机 ， 
就 会 从 那 台 主机 寻求 进入 因特网 上 的 其 他 主机 ， 从 而 形成 新 的 感染 主机 ， 再 寻求 进入 更 多 
的 主机 。 以 这 种 方式 ， 自 我 复制 的 恶意 软件 能 够 指数 式 地 快速 扩散 。 恶 意 软件 能 够 以 病毒 
或 蠕虫 的 形式 扩散 。 病 毒 (virus) 是 一 种 需要 某 种 形式 的 用 户 交互 来 感染 用 户 设备 的 恶意 
软件 。 典 型 的 例子 是 包含 恶意 可 执行 代码 的 电子 邮件 附件 。 如 果 用 户 接收 并 打开 这 样 的 附 
件 ， 不 经 意 间 就 在 其 设备 上 运行 了 该 恶意 软件 。 通 常 ， 这 种 电子 邮件 病毒 是 自我 复制 的 : 
例如 ， 一旦 执行 ， 该 病毒 可 能 向 用 户 地 址 敌 上 的 每 个 接收 方 发 送 一 个 具有 相同 恶意 附件 的 
相同 报 文 。 蠕 虫 〈《worm) 是 一 种 无 须 任何 明显 用 户 交互 就 能 进入 设备 的 恶意 软件 。 例 如 ， 
用 户 也 许 运 行 了 一 个 攻击 者 能 够 发 送 恶意 软件 的 脆弱 网 络 应 用 程序 。 在 某 些 情况 下 ， 没 有 
用 户 的 任何 干预 ， 该 应 用 程序 可 能 从 因特网 接收 恶意 软件 并 运行 它 ， 生 成 了 蠕虫 。 新 近 感 
染 设 备 中 的 蠕虫 则 能 扫描 因特网 ， 搜 索 其 他 运行 相同 网 络 应 用 程序 的 易 受 感染 的 主机 。 当 
它 发 现 其 他 易 受 感染 的 主机 时 ， 便 向 这 些 主机 发 送 一 个 它 自身 的 副本 。 今 天 ， 亚 意 软件 无 
所 不 在 且 防 范 成 本 高 。 当 你 用 这 本 书 学 习 时 ， 我 们 鼓励 你 思考 下 列 问 题 计算 机 网 络 设计 
者 能 够 采取 什么 防御 措施 ， 以 使 与 因特网 连接 的 设备 免 受 恶 意 软 件 的 攻击 ? 

2. 坏 家 伙 能 够 攻击 服务 器 和 网 络 基 础 设施 

男 一 种 宽泛 类 型 的 安全 性 威胁 称 为 拒绝 服务 攻击 ( Denial- of- Service (DoS) attack)。 
顾名思义 ，DoS 攻击 使 得 网 络 、 主 机 或 其 他 基础 设施 部 分 不 能 由 合法 用 户 使 用 。Web 服务 
器 、 电 子 邮 件 服 务 器 、DNS 服务 器 (在 第 2 章 中 讨论 ) 和 机 构 网 络 都 能 够 成 为 DoS 攻击 
的 目标 。 因 特 网 DoS 攻击 极为 常见 ， 每 年 会 出 现 数 以 千 计 的 DoS 攻击 【Moore 2001], i 
问 数字 攻击 图 (Digital Attack Map) 站 点 可 以 观看 世界 范围 内 每 天 最 厉害 的 DoS 攻击 
[DAM 2016], KARAM DoS 攻击 属于 下 列 三 种 类 型 之 一 : 
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。 弱点 攻击 。 这 涉及 向 一 台 目 标 主机 上 运行 的 易 受 攻击 的 应 用 程序 或 操作 系统 发 送 
制作 精细 的 报 文 。 如 果 适 当 顺 序 的 多 个 分 组 发 送 给 一 个 易 受 攻击 的 应 用 程序 或 操 
作 系 统 ， 该 服务 器 可 能 停止 运行 ,或 者 更 糟糕 的 是 主机 可 能 月 演 。 
。 带宽 洪 泛 。 攻 击 者 向 目标 主机 发 送 大 量 的 分 组 ,分 组 数量 之 多 使 得 目标 的 接 入 链 
路 变 得 拥塞 ， 使 得 合法 的 分 组 无 法 到 达 服 务 器 。 
© 连接 洪 泛 。 攻 击 者 在 目标 主机 中 创建 大 量 的 半 开 或 全 开 TCP 连接 (将 在 第 3 章 中 
讨论 TCP 连接 )。 该 主机 因 这 些 伪 造 的 连接 而 陷入 困境 ， 并 停止 接受 合法 的 连接 。 
我 们 现在 更 详细 地 研究 这 种 带宽 洪 泛 攻击 。 回 顾 1.4.2 节 中 讨论 的 时 延 和 丢 包 问题 ， 
显然 ， 如果 某 服务 器 的 接 入 速率 为 R bps， 则 攻击 者 将 需要 以 大 约 R bps 的 速率 来 产生 危 
Ho WR 非常 大 的 话 ， 单 一 攻击 源 可 能 无 法 产生 足够 大 的 流量 来 伤害 该 服务 器 。 此 外 ， 
如 果 从 单一 源 发 出 所 有 流量 的 话 ， 某 上 游 路 由 器 就 能 够 检测 出 该 攻击 并 在 该 流量 靠近 服务 
器 之 前 就 将 其 阻挡 下 来 。 在 图 1-25 中 显示 的 分 布 式 DOS (Distributed DoS, DDoS) 中 ， 攻 
击 者 控制 多 个 源 并 让 每 个 源 向 目标 猛烈 发 送 流量 。 使 用 这 种 方法 ， 遍 及 所 有 受 控 源 的 聚合 
流量 速率 需要 大 约 R 的 能 力 来 使 该 服务 陷入 瘫痪 。DDoS 攻击 充分 利用 由 数 以 千 计 的 受害 
主机 组 成 的 僵尸 网 络 ， 这 在 今天 是 屡见不鲜 的 [DAM 2016]。 相 比 于 来 自 单一 主机 的 DoS 
攻击 ，DDoS 攻击 更 加 难以 检测 和 防范 。 





图 1-25 “分 布 式 拒绝 服务 攻击 
当 学 习 这 本 书 时 ， 我 们 鼓励 你 考虑 下 列 问题 : 计算 机 网 络 设计 者 能 够 采取 哪些 措施 防 
JE DoS 攻击 ”我 们 将 看 到 ， 对 于 3 种 不 同类 型 的 DoS 攻击 需要 采用 不 同 的 防御 方法 。 
3. 坏 家 伙 能 够 噢 探 分 组 


今天 的 许多 用 户 经 无 线 设备 接 入 因特网 ， 如 WiFi 连接 的 膝 上 计算 机 或 使 用 蜂窝 因 特 
网 连接 的 手持 设备 (在 第 7 章 中 讨论 ) 。 无 所 不 在 的 因特网 接 人 极为 便利 并 让 移动 用 户 方 
便 地 使 用 令 人 惊奇 的 新 应 用 程序 的 同时 ， 也 产生 了 严重 的 安全 脆弱 性 一 一 在 无 线 传 输 设备 
的 附近 放置 一 台 被 动 的 接收 机 ， 该 接收 机 就 能 得 到 传输 的 每 个 分 组 的 副本 ! 这 些 分 组 包含 
了 各 种 敏感 信息 ， 包 括 口令 、 社 会 保险 号 、 商 业 秘 密 和 隐秘 的 个 人 信息 。 记 录 每 个 流 经 的 
分 组 副本 的 被 动 接收 机 被 称 为 分 组 嗅 探 器 (packet sniffer) 。 

嗅 探 器 也 能 够 部 署 在 有 线 环境 中 。 在 有 线 的 广播 环境 中 ， 如 在 许多 以 太 网 LAN 中 ， 
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分 组 嗅 探 器 能 够 获得 经 该 LAN 发 送 的 所 有 分 组 。 如 在 1.2 节 中 描述 的 那样 ， 电 缆 接 人 技 
术 也 广播 分 组 ， 因 此 易于 受到 嗅 探 攻击 。 此 外 ， 获 得 某 机 构 与 因特网 连接 的 接 入 路 由 器 或 
接 人 链 路 访问 权 的 坏 家 伙 能 够 放置 一 台 嗅 探 器 以 产生 从 该 机 构 出 人 的 每 个 分 组 的 副本 ， 再 
对 嗅 探 到 的 分 组 进行 离线 分 析 ， 就 能 得 出 敏感 信息 。 

分 组 嗅 探 软件 在 各 种 Web 站 点 上 可 免费 得 到 ， 这 类 软件 也 有 商用 的 产品 。 教 网 络 课 
程 的 教授 布置 的 实验 作业 就 涉及 写 一 个 分 组 嗅 探 器 和 应 用 层 数据 重 构 程 序 。 与 本 书 相 关联 
的 Wireshark [ Wireshark 2016] 实验 (参见 本 章 结 尾 处 的 Wireshark 实验 介绍 ) 使 用 的 正 
是 这 样 一 种 分 组 嗅 探 器 ! 

因为 分 组 嗅 探 器 是 被 动 的 ， 也 就 是 说 它们 不 向 信道 中 注入 分 组 ， 所 以 难以 检测 到 它 
们 。 因 此 ， 当 我 们 向 无 线 信 道 发 送 分 组 时 ,我们 必须 接受 这 样 的 可 能 性 ， 即 某 些 坏 家 伙 可 
能 记录 了 我 们 的 分 组 的 副本 。 如 你 已 经 猜想 的 那样 ， 最 好 的 防御 嗅 探 的 方法 基本 上 都 与 密 
码 学 有 关 。 我 们 将 在 第 8 章 研究 密码 学 应 用 于 网 络 安全 的 有 关内 容 。 

4， 坏 家 伙 能 够 伪装 成 你 信任 的 人 


生成 具有 任意 源 地 址 、 分 组 内 容 和 目的 地 址 的 分 组 ， 然 后 将 这 个 人 工 制作 的 分 组 传输 
到 因特网 中 ， 因 特 网 将 忠实 地 将 该 分 组 转发 到 目的 地 ， 这 一 切 都 极为 容易 ( 当 你 学 完 这 本 
教科 书后 ， 你 将 很 快 具 有 这 方面 的 知识 了 !) 。 想 象 某 个 接收 到 这 样 一 个 分 组 的 不 会 猜疑 的 
接收 方 ( 比如 说 一 台 因 特 网 路 由 器 )， 将 该 (虚假 的 ) 源 地 址 作为 真实 的 ， 进 而 执行 某 些 
般 和 在 该 分 组 内 容 中 的 命令 〈 比如 说 修改 它 的 转发 表 ) 。 将 具有 虚假 源 地 址 的 分 组 注入 因 
特 网 的 能 力 被 称 为 IP 哄骗 (IP spoofing) ， 而 它 只 是 一 个 用 户 能 够 冒充 另 一 个 用 户 的 许多 
方式 中 的 一 种 。 

为 了 解决 这 个 问题 ， 我 们 需要 采用 端点 鉴别 ， 即 一 种 使 我 们 能 够 确信 一 个 报 文 源 自 我 
们 认为 它 应 当 来 自 的 地 方 的 机 制 。 当 你 继续 学 习 本 书 各 章 时 ， 再 次 建议 你 思考 怎样 为 网 络 
应 用 程序 和 协议 做 这 件 事 。 我 们 将 在 第 8 章 探讨 端点 鉴别 机 制 。 

在 本 节 结 束 时 ， 值 得 思考 一 下 因特网 是 如 何 从 一 开始 就 落 入 这 样 一 种 不 安全 的 境地 
Ho KREV, BRE: 因特网 最 初 就 是 基于 “一 群 相 互信 任 的 用 户 连接 到 一 个 透明 的 网 
络 上 ”这 样 的 模型 [ Blumenthal 2001] 进行 设计 的 ， 在 这 样 的 模型 中 ， 安 全 性 是 没有 必要 
的 。 初 始 的 因特网 体系 结构 在 许多 方面 都 深刻 地 反映 了 这 种 相互 信任 的 理念 。 例 如 ， 一 个 
用 户 向 任何 其 他 用 户 发 送 分 组 的 能 力 是 默认 的 ， 而 不 是 一 种 请 求 / 准 予 的 能 力 ， 还 有 用 户 
身份 取 自 所 宣称 的 表面 价值 ， 而 不 是 默认 地 需要 鉴别 。 

但 是 今天 的 因特网 无 疑 并 不 涉及 “相互 信任 的 用 户 ”。 但是, 今天 的 用 户 仍 然 需 要 通 
信 ， 当 他 们 不 必 相 互信 任 时 ， 他 们 也 许 希 望 匿名 通信 ， 也 许 间 接地 通过 第 三 方 通信 (例如 
我 们 将 在 第 2 章 中 学 习 的 Web 高 速 缓存 ,我们 将 在 第 7 章 学 习 的 移动 性 协助 代理 ) hit 
不 信任 他 们 通信 时 使 用 的 硬件 、 软 件 甚至 空气 。 随 着 我 们 进一步 学 习 本 书 ， 会 面临 许多 安 
全 性 相关 的 挑战 : 我 们 应 当 寻 求 对 嗅 探 、 端 点 假冒 、 中 间 人 攻击 、DDos 攻击 、 亚 意 软 件 
等 的 防护 办 法 。 我 们 应 当 记 住 : 在 相互 信任 的 用 户 之 间 的 通信 是 一 种 例外 而 不 是 规则 。 欢 
迎 你 到 现代 计算 机 网 络 世 界 ! 


1.7 计算 机 网 络 和 因特网 的 历史 


1. 1 WR 1. 6 节 概 述 了 计算 机 网 络 和 因特网 的 技术 。 你 现在 应 当 有 是 够 的 知识 来 给 家 
人 和 朋友 留 下 深刻 印象 了 。 然 而 ， 如 果 你 真 的 想 在 下 次 鸡尾酒 会 上 一 鸣 惊 人 ,你 应 当 在 你 
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ABER Ae EES LAA ER PLT [ Segaller 1998 ] 。 
1.7.1 分 组 交换 的 发 展 : 1961 ~ 1972 


计算 机 网 络 和 今天 因特网 领域 的 开端 可 以 追溯 到 20 世纪 60 年 代 早 期 ， 那 时 电话 网 是 
世界 上 占 统 治 地 位 的 通信 网 络 。1. 3 节 讲 过 ， 电 话 网 使 用 电路 交换 将 信息 从 发 送 方 传输 到 
接收 方 ， 这 种 适当 的 选择 使 得 语音 以 一 种 恒定 的 速率 在 发 送 方 和 接收 方 之 间 传 输 。 随 着 20 
世纪 60 年 代 早 期 计算 机 的 重要 性 越 来 越 大 ， 以 及 分 时 计算 机 的 出 现 ， 考 虑 如 何 将 计算 机 
连接 在 一 起 ， 并 使 它们 能 够 被 地 理 上 分 布 的 用 户 所 共享 的 问题 ， 也 许 就 成 了 一 件 自 然 的 
事 。 这 些 用 户 所 产生 的 流量 很 可 能 具有 突 发 性 ， 即 活动 的 间断 性 ， 例 如 向 远程 计算 机 发 送 
一 个 命令 ， 接 着 是 静止 的 时 间 段 ， 这 是 等 待 应 答 或 对 接收 到 的 响应 进行 思考 的 时 间 。 

全 世界 有 3 个 研究 组 首先 发 明了 分 组 交换 ， 以 作为 电路 交换 的 一 种 有 效 的、 健壮 的 替 
代 技 术 。 这 3 个 研究 组 互 不 知道 其 他 大 的 工作 [Leiner 1998 ] 。 有 关 分 组 交换 技术 的 首次 
公开 发 表 出 自 Leonard Kleinrock [ Kleinrock 1961; Kleinrock 1964 ] ， 那 时 他 是 麻 省 理工 学 
院 (MIT) 的 一 名 研究 生 。Kleinrock 使 用 排队 论 ， 完 美 地 体现 了 使 用 分 组 交换 方法 处 理 突 
发 性 流量 源 的 有 效 性 。1964 年 ， 兰 德 公司 的 Paul Baran [Baran 1964] 已 经 开始 研究 分 组 
交换 的 应 用 ， 以 在 军用 网 络 上 传输 安全 语音 ， 同 时 在 英国 的 国家 物理 实验 室 (NPL)， 
Donald Davies 和 Roger Scantlebury 也 在 研究 分 组 交换 技术 。 

MIT、 兰 德 和 NPL 的 工作 奠定 了 今天 的 因特网 的 基础 。 但 是 因特网 也 经 历 了 很 长 的 
“ 边 构 建 边 示范 (let’ s-build-it-and- demonstrate-it) ”的 历史 ， 这 可 追溯 到 20 世纪 60 年 代 
早期 。J. C. R. Licklider [DEC 1990] 和 Lawrence Roberts 都 是 Kleinrock 在 MIT 的 同事 ， 他 
们 转 而 去 领导 美国 高 级 研究 计划 署 (Ad- 
vanced Research Projects Agency, ARPA) 的 
计算 机 科学 计划 。Roberts 公布 了 一 个 ARPA- 
net [ Roberts 1967] 的 总 体 计 划 ， 它 是 第 一 
个 分 组 交换 计算 机 网 络 ， 是 今天 的 公共 因 特 
网 的 直接 祖先 。 在 1969 年 的 劳动 节 ， 第 一 台 
分 组 交换 机 在 Kleinrock 的 监管 下 安装 在 美国 
加 州 大 学 洛杉矶 分 校 (UCLA)， 其 他 3 台 分 
组 交换 机 不 久 后 安装 在 斯 坦 福 研究 所 ( Stan- 
ford Research Institute，SRI) 、 美 国 加 州 大 学 
圣 巴巴 拉 分 校 (UC Santa Barbara) 和 犹他 大 
学 (University of Utah) (参见 图 1-26), W 
翼 未 丰 的 因特网 祖先 到 1969 年 年 底 有 了 4 个 
节点 。Kleinrock 回忆 说 ， 该 网 络 的 最 先 应 用 
是 从 UCLA 到 SRI 执行 远程 注册 ,但 却 导 致 
了 该 系统 的 月 演 [Kleinrock 2004] 。 

到 了 1972 年 ，ARPAnet 已 经 成 长 到 大 约 
15 个 节点 ， 由 Robert Kahn 首次 对 它 进行 了 
公开 演示 。 在 ARPAnet 端 系统 之 间 的 第 一 台 = “ii s 
主机 到 主机 协议 一 一 称 为 网 络 控制 协议 图 1-26 一 台 早期 的 分 组 交换 机 
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(NCP) ， 就 是 此 时 完成 的 【RFC 001] 。 随 着 端 到 端 协议 的 可 供 使 用 ， 这 时 能 够 写 应 用 程 
序 了 。 在 1972 年 ，Ray Tomlinson 编写 了 第 一 个 电子 邮件 程序 。 


1.7.2 专用 网 络 和 网 络 互联 : 1972 ~1980 


最 初 的 ARPAnet 是 一 个 单一 的 、 封 闭 的 网 络 。 为 了 与 ARPAnet 的 一 台 主 机 通信 ， 
台 主 机 必须 与 另 一 台 ARPAnet IMP 实际 相连 。20 世纪 70 年 代 早 期 和 中 期 ， 除 ARPAnet 之 
外 的 其 他 分 组 交换 网 络 问世 : ALOHAnet 是 一 个 微波 网 络 ， 它 将 夏威夷 岛 上 的 大 学 
[ Abramson 1970] 以 及 DARPA 的 分 组 卫星 [RFC 829] 和 分 组 无 线 电网 [Kahn 1987] 连 
接 到 一 起 ; Telenet 是 BBN 的 商用 分 组 交换 网 ， 它 基于 ARPAnet 技术 ; 由 Louis Pouzin 领衔 
的 Cyclades 是 法 国 的 一 个 分 组 交换 网 [Think 2012]; 还 有 如 Tymnet 和 GE 信息 服务 网 这 
样 的 分 时 网 络 ， 以 及 20 世纪 60 年 代 后 期 和 70 年 代 初 期 的 类 似 网 络 [ Schwartz 1977 ] ; 
IBM 的 SNA (1996 ~1974 ) ， 它 与 ARPAnet 同时 在 运行 [Schwartz 1977 ] 。 

网 络 的 数目 开始 增加 。 人 们 事后 看 到 ， 研 制 将 网 络 连接 到 一 起 的 体系 结构 的 时 机 已 经 
成 熟 。 互 联网 络 的 先驱 性 工作 (得 到 了 美国 国防 部 高 级 研究 计划 署 (DARPA) 的 支持 ) 
由 Vinton Cerf 和 Robert Kahn [ Cerf 1974] 完成 ， 本 质 上 就 是 创建 一 个 网 络 的 网 络 ; 术语 网 
络 互联 (internetting) 就 是 用 来 描述 该 项 工作 的 。 

这 些 体系 结构 的 原则 体现 在 TCP 中。 然而，TCP 的 早期 版 本 与 今天 的 TCP 差异 很 大 。 
TCP 的 早期 版 本 将 通过 端 系统 重 传 的 可 靠 按 序数 据 传递 〈 仍 是 今天 的 TCP 的 一 部 分 ) 与 
转发 功能 (今天 该 功能 由 IP 执行 ) MAA. TCP 的 早期 实验 以 及 认识 到 对 诸如 分 组 语音 
这 样 的 应 用 程序 中 不 可 靠 的 、 非 流 控制 的 、 端 到 端 传递 服务 的 重要 性 ， 导 致 人 从 TCP 中 
分 离 出 来 ， 并 研制 了 UDP 协议 。 我 们 今天 看 到 的 3 个 重要 的 因特网 协议 一 一 TCP、UDP 和 
IP， 到 20 世纪 70 年 代 末 在 概念 上 已 经 完成 。 

除了 DARPA 的 因特网 相关 研究 外 ， 许 多 其 他 重要 的 网 络 活动 也 在 进行 中 。 在 夏威夷 ， 
Norman Abramson 正在 研制 ALOHAnet， 这 是 一 个 基于 分 组 的 无 线 电 网 络 ， 它 使 在 夏威夷 岛 
上 的 多 个 远程 站 点 互相 通信 。ALOHA 协议 [Abramson 1970] 是 第 一 个 多 路 访问 协议 ， 允 
许 地 理 上 分 布 的 用 户 共享 单一 的 广播 通信 媒体 (一 个 无 线 电 频率 ) 。Metcalfe 和 Boggs 基于 
Abramson 的 多 路 访问 协议 ， 研 制 了 用 于 有 线 共享 广播 网 络 的 以 太 网 协议 [Metcalfe 1976 ] 。 
令 人 感 兴趣 的 是 ，Metcalfe 和 Boggs 的 以 太 网 协议 是 由 连接 多 台 PC、 打印 机 和 共享 磁盘 在 
一 起 的 需求 所 激励 的 【Perkins 1994]。 在 PC 革命 和 网 络 爆炸 的 25 年 之 前 ，Metcalfe 和 
Boggs 就 商定 了 今天 PC LAN 的 基础 。 


1.7.3 网 络 的 激增 : 1980 ~ 1990 


到 了 20 世纪 70 ERK, KA 200 台 主 机 与 ARPAnet 相连 。 到 了 20 世纪 80 年 代 末 ， 
连 到 公共 因特网 的 主机 数量 达到 100 000 台 ， 那 时 的 公共 因特网 是 网 络 的 联盟 ， 看 起 来 非 
常 像 今天 的 因特网 。20 世纪 80 年 代 是 联网 主机 数量 急剧 增长 的 时 期 。 

这 种 增长 是 由 几 个 显著 成 果 即 创建 计算 机 网 络 将 大 学 连接 到 一 起 引起 的 。BITNET 为 
位 于 美国 东北 部 的 几 个 大 学 之 间 提 供 了 电子 邮件 和 文件 传输 。 建 立 了 CSNET (计算 机 科学 
网 ) ， 以 将 还 没有 接 人 ARPAnet 的 大 学 研究 人 员 连 接 在 一 起 。1986 年 ， 建立 了 NSFNET, 
为 NSF 资助 的 超级 计算 中 心 提供 接 人 。NSFNET 最 初 具 有 56kbps 的 主干 速率 ， 到 了 20 世 
纪 80 年 代 未 ， 它 的 主干 运行 速率 是 1. 5Mbps， 并 成 为 连接 区 域 网 络 的 基本 主干 。 

在 ARPAnet 界 中 ， 许 多 今天 的 因特网 体系 结构 的 最 终 部 分 逐渐 变 得 清晰 起 来 。1983 
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年 1 月 1 日 见证 了 TCP/IP 作为 ARPAnet 新 的 标准 主机 协议 的 正式 部 署 ， 替 代 了 NCP 协 
iL. JA NCP 到 TCP/IP 的 迁移 [RFC 801] 是 一 个 标志 性 事件 ， 所 有 主机 被 要 求 在 那天 转 
HA] TCP/IP 上 去 。 在 20 世纪 80 年 代 后 期 ，TCP 进行 了 重要 扩展 ， 以 实现 基于 主机 的 拥 
塞 控制 [Jacobson 1988 ] 。 还 研制 出 了 DNS (域名 系统 ) ， 用 于 将 人 可 读 的 因特网 名 字 (H 
如 gaia. cs. umass. edu) 映射 到 它 的 32 比特 卫 地 址 [RFC 1034], 

在 20 世纪 80 年 代 初 期 在 ARPAnet (这 绝 大 多 数 是 美国 的 成 果 ) 发 展 的 同时 ， 法 国 
启动 了 Minitel 项 目 ， 这 个 雄心 勃勃 的 计划 是 让 数据 网 络 进 大 每 个 家 庭 。 在 法 国政 府 的 文 
持 下 ，Minitel 系统 由 公共 分 组 交换 网 络 (基于 X. 25 协议 集 ) Minitel 服务 器 和 具有 内 置 
低速 调制 解 调 器 的 廉价 终端 组 成 。Minitel 于 1984 年 取得 了 巨大 的 成 功 ， 当 时 法 国政 府 向 
每 个 需要 的 住户 免费 分 发 一 个 Minitel 终端 。Minitel 站 点 包括 免费 站 点 〈 如 电话 目录 站 点 ) 
以 及 一 些 专用 站 点 ， 这 些 专用 站 点 根据 每 个 用 户 的 使 用 来 收取 费用 。 在 20 世纪 90 年 代 中 
期 的 易 盛 时 期 Minitel 提供 了 20 000 多 种 服务 ， 涵 盖 从 家 庭 银 行 到 特殊 研究 数据 库 的 广泛 
范围 。Minitel 在 大 量 法 国家 庭 中 存在 了 10 年 后 ， 大 多 数 美 国人 才 听 说 因特网 。 


1.7.4 因特网 爆炸 : 20 世纪 90 年 代 


20 世纪 90 年 代 出 现 了 许多 事件 ， 这 些 事件 标志 着 因特网 持续 革命 和 很 快 到 来 的 商业 
化 。 作 为 因特网 祖先 的 ARPAnet 已 不 复 存 在 。1991 年 ，NSFNET 解除 了 对 NSFNET 用 于 商 
业 目 的 的 限制 。NSFNET 自身 于 1995 年 退役 ， 这 时 因特网 主干 流量 则 由 商业 因特网 服务 提 
供 商 负责 承载 。 

然而 ，20 世纪 90 年 代 的 主要 事件 是 万 维 网 ( World Wide Web) 应 用 程序 的 出 现 ， 它 
将 因特网 带 人 世界 上 数 以 百 万 计 的 家 庭 和 商业 中 。Web 作为 一 个 平台 ， 也 引入 和 配置 了 数 
百 个 新 的 应 用 程序 ， 其 中 包括 搜索 (如 谷歌 和 Bing) 、 因 特 网 商务 (如 亚马逊 和 eBay) 以 
及 社交 网 络 〈 如 脸 书 ) ， 对 这 些 应 用 程序 我 们 今天 已 经 习以为常 了 。 

Web 是 由 Tim Berners- Lee 于 1989 ~ 1991 年 间 在 CERN 发 明 的 [Berners- Lee 1989 |, 
最 初 的 想法 源 于 20 世纪 40 年 代 Vannevar Bush [ Bush 1945] 和 20 世纪 60 年 代 以 来 Ted 
Nelson [ Xanadu 2012] 在 超 文本 方面 的 早期 工作 。Berners- Lee 和 他 的 同事 研制 了 HTML, 
HTTP, Web 服务 器 和 浏览 器 的 初始 版 本 ， 这 是 Web 的 4 个 关键 部 分 。 到 了 1993 年 年 底 前 
ja, KAA 200 & Web 服务 器 在 运行 ， 而 这 些 只 是 正在 出 现 的 Web 服务 器 的 冰山 一 角 。 
就 在 这 个 时 候 ， 几 个 研究 人 员 研 制 了 具有 GUI 接口 的 Web 浏览 器 ， 其 中 的 Mare Andrees- 
sen 和 Jim Clark 一 起 创办 了 Mosaic Communications 公司 ， 该 公司 就 是 后 来 的 Netscape 通信 
公司 [Cusmano 1998; Quittner 1998], 。 到 了 1995 年 ， 大 学 生 们 每 天 都 在 使 用 Netscape X 
览 器 在 Web 上 冲浪 。 大 约 在 这 段 时 间 ， 大 大 小 小 的 公司 都 开始 运行 Web 服务 器 ， 并 在 
Web 上 处 理 商 务 。1996 年 ， 微 软 公 司 开始 开发 浏览 器 ， 这 导致 了 Netscape 和 微软 之 间 的 
浏览 器 之 战 ， 并 以 微软 公司 在 几 年 后 获胜 而 告终 [Cusumano 1998 ] 。 

20 世纪 90 年 代 的 后 5 年 ， 随 着 主流 公司 和 数 以 千 计 的 初创 公司 创造 了 大 量 因特网 产 
品 和 服务 ， 因 特 网 到 了 飞速 增长 和 创新 的 时 期 。 到 了 2000 年 末 ， 因 特 网 已 经 支持 数 百 流 
行 的 应 用 程序 ， 包 括 以 下 4 种 备 受 欢迎 的 应 用 程序 : 

。 电子 邮件 ， 包 括 附件 和 Web 可 访问 的 电子 邮件 。 

e Web， 包 括 Web 浏览 和 因特网 商务 。 

。 即时 讯息 (instant messaging) ， 具 有 联系 人 列表 。 

e MP3 的 对 等 (peer-to-peer) 文件 共享 H Napster 开创 。 
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值得 一 提 的 是 ， 前 两 个 应 用 程序 出 自 专业 研究 机 构 ， 而 后 两 个 却 由 一 些 年 轻 创 业者 所 


发 明 。 


1995 ~2001 年 ， 这 段 时 间 也 是 因特网 在 金融 市 场 上 和 急 转 突 变 的 时 期 。 在 成 为 有 利 可 图 
的 公司 之 前 ， 数 以 百 计 的 因特网 初创 公司 靠 首次 公开 募股 (IPO) 并 在 股票 市 场 上 交易 起 
家 。 许 多 公司 身价 数 十 亿美 元 ， 却 没有 任何 主要 的 收入 渠道 。 因 特 网 的 股票 在 2000 ~ 2001 
年 崩盘 ， 导 致 许多 初创 公司 倒闭 。 不 过 ， 也 有 许多 公司 成 为 因特网 世界 的 大 赢家 ， 包 括 微 
软 、 思 科 、 雅 虎 、e-Bay 、 谷 歌 和 亚马逊 。 


1,,7..5 


最 新 发 展 


计算 机 网 络 中 的 变革 继续 以 急促 的 步伐 前 进 。 所 有 的 前 沿 研究 正在 取得 进展 ， 包括 部 
署 更 快 的 路 由 器 和 在 接 人 网 和 网 络 主干 中 提供 更 高 的 传输 速率 。 但 下 列 进展 值得 特别 


关注 : 


1.8 


自 2000 年 开始 ， 我 们 见证 了 家 庭 宽带 因特网 接 入 的 积极 部 署 一 一 不 仅 有 电线 调制 
解 调 器 和 DSL， 而 且 有 光纤 到 户 ， 这 些 在 1. 2 节 中 讨论 过 。 这 种 高 速 因特网 为 丰 
富 的 视频 应 用 创造 了 条 件 ， 包 括 用 户 生成 的 视频 的 分 发 (例如 YouTube) 、 电 影 和 
电视 节目 的 按 需 流 (例如 Netflix) 以 及 多 人 视频 会 议 (例如 Skype, Facetime 和 
Google Hangouts) 。 

AE (54Mbps 及 更 高 ) 公共 WiFi 网 络 和 经 过 4G 蜂窝 电话 网 的 中 速 ( 几 十 Mbps) 
因特网 接 入 越 来 越 普及 ， 不 仅 使 在 运动 中 保持 持续 连接 成 为 可 能 ， 也 产生 了 新 型 
特定 位 置 应 用 ， 如 Yelp, Tinder, Yik Yak 和 Waz。2011 年 ， 与 因特网 连接 的 无 线 
设备 的 数量 超过 了 有 线 设备 的 数量 。 高 速 无 线 接 人 为 手持 计算 机 (iPhone、 安 卓 
FHL, iPad 等 ) 的 迅速 出 现 提 供 了 和 舞台， 这 些 手 持 计算 机 具有 对 因特网 持续 不 断 
和 无 拘束 接 人 的 优点 。 

诸如 脸 书 、Instagram、 推 特 ( Twitter) 和 微 信 (在 中 国 极为 流行 ) 这 样 的 在 线 
社交 网 络 已 经 在 因特网 之 上 构建 了 巨大 的 人 际 网 络 。 这 些 社交 网 络 ， 许 多 广泛 
用 于 发 送 消息 以 及 照片 分 享 。 许 多 因特网 用 户 今天 主要 “生活 ”在 一 个 或 多 个 
社交 网 络 中 。 通 过 他 们 的 API， 在 线 社交 网 络 为 新 的 联网 应 用 和 分 布 式 游戏 创建 
了 平谷 

如 在 1. 3. 3 节 中 所 讨论 的 ， 在 线 服务 提供 商 如 谷歌 和 微软 已 经 广泛 部 署 了 自己 的 
专用 网 络 。 该 专用 网 络 不 仅 将 它们 分 布 在 全 球 的 数据 中 心 连接 在 一 起 ， 而 且 通 过 
直接 与 较 低层 ISP 对 等 连接 ， 能 够 尽 可 能 绕 过 因特网 。 因 此 ， 谷 歌 几 乎 可 以 瞬间 
提供 搜索 结果 和 电子 邮件 访问 ， 仿 佛 它们 的 数据 中 心 运行 在 自己 的 计算 机 中 一 样 。 
许多 因特网 商务 公司 在 “ 云 ”( 如 亚马逊 的 EC2、 谷 歌 的 应 用 引擎、 微软 的 Azure) 
中 运行 它们 的 应 用 。 许 多 公司 和 大 学 也 已 经 将 它们 的 因特网 应 用 (如 电子 邮件 和 
Web 托管 ) 迁移 到 云 中 。 云 公司 不 仅 可 以 为 应 用 提供 可 扩展 的 计算 和 存储 环境 ， 
也 可 为 应 用 提供 对 其 高 性 能 专用 网 络 的 隐 含 访问 。 


小 结 


在 本 章 中 ， 我 们 涉及 了 大 量 的 材料 ! 我 们 已 经 看 到 构成 特别 的 因特网 以 及 一 般 的 计算 
机 网 络 的 各 种 硬件 和 软件 。 我 们 从 网 络 的 边缘 开始 ， 观 察 端 系统 和 应 用 程序 ， 以 及 运行 在 
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端 系统 上 为 应 用 程序 提供 的 运输 服务 。 接 着 我 们 也 观察 了 通常 能 够 在 接 人 网 中 找到 的 链 路 
层 技术 和 物理 媒体 。 然 后 我 们 进入 网 络 核心 更 深入 地 钻研 网 络 ， 看 到 分 组 交换 和 电路 交换 
是 通过 电信 网 络 传输 数据 的 两 种 基本 方法 ， 并 且 探讨 了 每 种 方法 的 长 处 和 短处 。 我 们 也 研 
究 了 全 球 性 因特网 的 结构 ， 知 道 了 因特网 是 网 络 的 网 络 。 我 们 看 到 了 因特网 的 由 较 高 层 和 
较 低 层 ISP 组 成 的 等 级 结构 ， 人 允许 该 网 络 扩展 为 包括 数 以 千 计 的 网 络 。 

在 这 个 概述 性 章节 的 第 二 部 分 ， 我 们 研究 了 计算 机 网 络 领域 的 几 个 重要 主题 。 我 们 首 
先 研究 了 分 组 交换 网 中 的 时 延 、 香 吐 量 和 丢 包 的 原因 。 我 们 研究 得 到 传输 、 传 播 和 排队 时 
延 以 及 用 于 吞吐 量 的 简单 定量 模型 ;我 们 将 在 整 本 书 的 课 后 习题 中 多 处 使 用 这 些 时 延 模 
型 。 接 下 来 ， 我 们 研究 了 协议 分 层 和 服务 模型 、 网 络 中 的 关键 体系 结构 原则 ， 我 们 将 在 本 
书 多 处 引用 它们 。 我 们 还 概述 了 在 今天 的 因特网 中 某 些 更 为 流行 的 安全 攻击 。 我 们 用 计算 
机 网 络 的 简要 历史 结束 我 们 对 网 络 的 概述 。 第 1 章 本 身 就 构成 了 计算 机 网 络 的 小 型 课程 。 

因此 ,第 1 章 中 的 确 涉及 了 大 量 的 背景 知识 ! 如 果 你 有 些 不 知 所 云 ， 请 不 要 着 急 。 在 
后 继 几 章 中 我 们 将 重新 回顾 这 些 概 念 ， 更 为 详细 地 研究 它们 ( 那 是 承诺 ， 而 不 是 威胁 !1)。 
此 时 ， 我 们 和 希望 你 完成 本 章 内 容 的 学 习 时 ， 对 构建 网 络 的 众多 元 素 的 直觉 越 来 越 敏锐 ， 对 
网 络 词汇 越 来 越 精通 〈 不 妨 经 常 回 过 头 来 查阅 本 章 ) ， 对 更 加 深入 地 学 习 网 络 的 愿望 越 来 
越 强烈 。 这 些 也 是 在 本 书 的 其 余部 分 我 们 将 面临 的 任务 。 


本 书 的 路 线 图 


在 开始 任何 旅行 之 前 ， 你 总 要 先 查 看 路 线 图 ， 以 便 更 为 熟悉 前 面 的 主要 道路 和 交叉 路 
口 。 对 于 我 们 即将 开启 的 这 段 “旅行 ”而 言 ， 其 最 终 目 的 地 是 深入 理解 计算 机 网 络 “是 
什么 、 怎 么 样 和 为 什么 ”等 内 容 。 我 们 的 路 线 图 是 本 书 各 章 的 顺序 : 

第 1 章 计算 机 网 络 和 因特网 

第 2 章 应 用 层 

第 3 章 运输 层 

第 4 章 网 络 层 : 数据 平面 

第 5 章 网络 层 : 控制 平面 

第 6 章 链 路 层 和 局 域 网 

第 7 章 无线 网 络 和 移动 网 络 

第 8 章 ”计算 机 网 络 中 的 安全 

第 9 章 多 媒体 网 络 

第 2 ~6 章 是 本 书 的 5 个 核心 章 。 应 当 注 意 的 是 ， 这 些 章 都 围绕 5 层 因 特 网 协议 栈 上 
面 的 4 层 而 组 织 ， 其 中 一 章 对 应 一 层 。 要 进一步 注意 的 是 ， 我 们 的 旅行 将 从 因特网 协议 栈 
的 顶部 即 应 用 层 开始 ， 然 后 向 下 面 各 层 进行 学 习 。 这 种 自 顶 向 下 旅行 背后 的 基本 原理 是 ， 
一 旦 我 们 理解 这 些 应 用 程序 ， 就 能 够 理解 支持 这 些 应 用 程序 所 需 的 各 种 网 络 服务 。 然 后 能 
够 依次 研究 可 能 由 网 络 体系 结构 实现 的 服务 的 各 种 方式 。 较 早 地 涉及 应 用 程序 ， 也 能 够 对 
学 习 本 课程 其 余部 分 提供 动力 。 

第 7 ~9 章 关注 现代 计算 机 网 络 中 的 3 个 极为 重要 的 (并 且 在 某 种 程度 上 是 独立 的 ) 
主题 。 在 第 7 章 中 ,我 们 研究 了 无 线 网 络 和 移动 网 络 ， 包 括 无 线 LAN (其 中 有 WiFi 和 蓝 
牙 )、 蜂 窝 电 话 网 (包括 GSM、3G 和 4G) 以 及 移动 性 (在 四 网 络 和 GSM 网 络 中 的 ) 。 在 
第 8 章 中 ,我 们 首先 学 习 加 密 和 网 络 安 全 的 基础 知识 ， 然 后 研究 基础 理论 如 何 应 用 于 各 种 
各 样 的 因特网 环境 。 在 最 后 一 章 (第 9 章 ) 中 ,我 们 研究 了 音频 和 视频 应 用 ， 例 如 因特网 
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电话 、 视 频 会 议和 流 式 存储 媒体 。 此 外 ， 还 讨论 如 何 设计 分 组 交换 网 络 以 对 音频 和 视频 应 
用 程序 提供 一 致 的 服务 质量 。 


课 后 习题 和 问题 





1.1 节 

R1.“ 主 机 ”和 “ 端 系统 ”之 间 有 什么 不 同 ? 列举 几 种 不 同类 型 的 端 系统 。Web 服务 器 是 一 种 端 系统 吗 ? 

R2. “协议 ”一 词 常 被 用 于 描述 外 交 关 系 。 维 基 百 科 是 怎样 描述 外 交 协 议 的 ? 

R3. 标准 对 于 协议 为 什么 重要 ? 

1.2 节 

R4. 列 出 6 种 接 人 技术 。 将 它们 分 类 为 住宅 接 人 、 公 司 接 人 或 广 域 无 线 接 人 。 

RS. HFC 传输 速率 在 用 户 间 是 专用 的 还 是 共享 的 ? 在 下 行 HFC 信道 中 ， 可 能 出 现 磁 撞 吗 ? 为 什么 ? 

R6. 列 出 你 所 在 城市 中 的 可 供 使 用 的 住宅 接 人 技术 。 对 于 每 种 类 型 的 接 人 和 人 方式， 给 出 所 宣称 的 下 行 速率 、 
上 行 速率 和 每 月 的 价格 。 

R7. 以 太 LAN 的 传输 速率 是 多 少 ? 

R8. 能 够 运行 以 太 网 的 一 些 物理 媒体 是 什么 ? 

R9. 拨号 调制 解 调 器 、HFC、DSL 和 FTTH 都 用 于 住宅 接 入 。 对 于 这 些 技术 ,给 出 每 种 技术 的 传输 速率 的 
范围 ， 并 讨论 它们 的 传输 速率 是 共享 的 还 是 专用 的 。 

R10. 描述 今天 最 为 流行 的 无 线 因 特 网 接 人 技术 。 对 它们 进行 比较 和 对 照 。 

1.39% 

R11. 假定 在 发 送 主机 和 接收 主机 间 只 有 一 台 分 组 交换 机 。 发 送 主机 和 交换 机 间 以 及 交换 机 和 接收 主机 间 
的 传输 速率 分 别 是 尺 和 R,。 假 设 该 交换 机 使 用 存储 转发 分 组 交换 方式 ， 发送 一 个 长 度 为 工 的 分 组 
的 端 到 端 总 时 延 是 什么 ? (忽略 排队 时 延 、 传 播 时 延 和 处 理 时 延 。) 

R12. 与 分 组 交换 网 络 相 比 ， 电 路 交换 网 络 有 哪些 优点 ? 在 电路 交换 网 络 中 ，TDM E FDM 有 哪些 优点 ? 

R13. 假定 用 户 共 享 一 条 2Mbps 链 路 。 同 时 假定 当 每 个 用 户 传 输 时 连续 以 1Mbps 传输 ， 但 每 个 用 户 仅 传输 
20% 的 时 间 。 
a. 当 使 用 电路 交换 时 ， 能 够 支持 多 少 用 户 ? 
b. 作为 该 题 的 后 继 问 题 ， 假 定 使 用 分 组 交换 。 为 什么 如 果 两 个 或 更 少 的 用 户 同 时 传输 的 话 ， 在 链 

路 前 面 基 本 上 没有 排队 时 延 ? 为 什么 如 果 3 个 用 户 同时 传输 的 话 ， 将 有 排队 时 延 ? 
c 求 出 某 指定 用 户 正 在 传输 的 概率 。 
d 假定 现在 有 3 个 用 户 。 求 出 在 任何 给 定 的 时 间 ， 所 有 3 个 用 户 在 同时 传输 的 概率 。 求 出 队列 增长 
的 时 间 比 率 。 

R14. 为 什么 等 级 结构 中 级 别 相 同 的 两 个 ISP 通常 互相 对 等 ? 某 IXP 是 如 何 挣 钱 的 ? 

R15. 某 些 内 容 提 供 商 构建 了 自己 的 网 络 。 描 述 谷歌 的 网 络 。 内 容 提供 商 构建 这 些 网 络 的 动机 是 什么 ? 

1.4 节 

R16. 考虑 从 某 源 主机 跨越 一 条 固定 路 由 向 某 目的 主机 发 送 一 分 组 。 列 出 端 到 端 时 延 中 的 时 延 组 成 成 分 。 
这 些 时 延 中 的 哪些 是 固定 的 ， 哪 些 是 变化 的 ? 

R17. 访问 配套 Web 网 站 上 有 关 传 输 时 延 与 传播 时 延 的 Java 小 程序 。 在 速率 、 传 播 时 延 和 可 用 的 分 组 长 
度 之 中 找 出 一 种 组 合 ， 使 得 该 分 组 的 第 一 个 比特 到 达 接 收 方 之 前 发 送 方 结 束 了 传输 。 找 出 另 一 种 组 
合 ， 使 得 发 送 方 完成 传输 之 前 ， 该 分 组 的 第 一 个 比特 到 达 了 接收 方 。 

R18. 一 个 长 度 为 1000 字 节 的 分 组 经 距离 为 2500km 的 链 路 传播 ， 传 播 速率 为 2. 5 x 10° m/s 并 且 传 输 速率 
为 2Mbps， 它 需要 用 多 长 时 间 ? 更 为 一 般 地 ， 一 个 长 度 为 上 的 分 组 经 距离 为 d 的 链 路 传播 ， 传 播 速 


R19. 


R20. 


R21. 


1.5 


R22. 


R23. 
R24. 
R25. 


1.6 
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RH s 并 且 传输 速率 为 Rbps， 它 需要 用 多 长 时 间 ? 该 时 延 与 传输 速率 相关 吗 ? 

假定 主机 A 要 向 主机 B 发 送 一 个 大 文件 。 从 主机 A 到 主机 B 的 路 径 上 有 3 段 链 路 ， 其 速率 分 别 为 
R, =500kbps, R, =2Mbps, R, =1Mbps。 

a 假定 该 网 络 中 没有 其 他 流量 ， 该 文件 传送 的 吞吐 量 是 多 少 ? 

b. 假定 该 文件 为 4MB。 用 吞吐 量 除 以 文件 长 度 ， 将 该 文件 传输 到 主机 B 大 致 需要 多 长 时 间 ? 

c. 重复 (a) 和 (b)， 只 是 这 时 R, 减 小 到 100kbps。 

假定 端 系统 A 要 向 端 系统 B 发 送 一 个 大 文件 。 在 一 个 非常 高 的 层次 上 ， 描 述 端 系 统 怎样 从 该 文件 生 
成 分 组 。 当 这 些 分 组 之 一 到 达 某 分 组 交换 机 时 ， 该 交换 机 使 用 分 组 中 的 什么 信息 来 决定 将 该 分 组 转 
发 到 哪 一 条 链 路 上 ? 因特网 中 的 分 组 交换 为 什么 可 以 与 驱车 从 一 个 城市 到 另 一 个 城市 并 沿途 询问 方 
向 相 类 比 ? 

访问 配套 Web 站 点 的 排队 和 丢 包 Java 小 程序 。 最 大 发 送 速 率 和 最 小 的 传输 速率 是 多 少 ? 对 于 这 
些 速率 ， 流 量 强度 是 多 大 ? 用 这 些 速率 运行 该 Java 小 程序 并 确定 出 现 丢 包 要 花费 多 长 时 间 ? 然后 
第 二 次 重复 该 实验 ， 再 次 确定 出 现 丢 包 花费 多 长 时 间 。 这 些 值 有 什么 不 同 ? 为 什么 会 有 这 种 
现象 ? 

节 

列 出 一 个 层次 能 够 执行 的 5 个 任务 。 这 些 任务 中 的 一 个 〈 或 两 个 ) 可 能 由 两 个 (或 更 多 ) 层次 执 
行 吗 ? 

因特网 协议 栈 中 的 5 个 层次 有 哪些 ? 在 这 些 层次 中 ， 每 层 的 主要 任务 是 什么 ? 

什么 是 应 用 层 报 文 ? 什么 是 运输 层 报 文 段 ? 什么 是 网 络 层 数 据 报 ? 什么 是 链 路 层 帧 ? 

路 由 器 处 理 因特网 协议 栈 中 的 哪些 层次 ? 链 路 层 交换 机 处 理 的 是 哪些 层次 ? 主机 处 理 的 是 哪些 
层次 ? 

节 


R26. 病毒 和 蠕虫 之 间 有 什么 不 同 ? 
R27. 描述 如 何 产生 一 个 僵尸 网 络 ， 以 及 僵尸 网 络 是 怎样 被 用 于 DDoS 攻击 的 。 


R28. 


P1. 


P4. 


假定 Alice 和 Bob 经 计算 机 网 络 互相 发 送 分 组 。 假 定 Trudy 将 自己 安置 在 网 络 中 ， 使 得 她 能 够 俘获 由 
Alice 发 送 的 所 有 分 组 ， 并 发 送 她 希望 给 Bob 的 东西 ; 她 也 能 够 俘获 由 Bob 发 送 的 所 有 分 组 ， 并 发 
送 她 希望 给 Alice 的 东西 。 列 出 在 这 种 情况 下 Trudy 能 够 做 的 某 些 恶意 的 事情 。 


习题 


设计 并 描述 在 自动 柜员 机 和 银行 的 中 央 计 算 机 之 间 使 用 的 一 种 应 用 层 协 议 。 你 的 协议 应 当 允 许 验证 
用 户 卡 和 口令 ,查询 账 目 结算 (这些 都 在 中 央 计 算 机 中 进行 维护 ) ， 支 取 账目 〈 即 向 用 户 支付 钱 ) 。 
你 的 协议 实体 应 当 能 够 处 理 取 钱 时 账目 中 钱 不 够 的 常见 问题 。 通 过 列 出 自动 柜员 机 和 银行 中 央 计 算 
机 在 报 文 传输 和 接收 过 程 中 交换 的 报 文 和 采取 的 动作 来 定义 你 的 协议 。 使 用 类 似 于 图 1-2 所 示 的 图 ， 
拟定 在 简单 无 差错 取 钱 情况 下 该 协议 的 操作 。 明 确 地 阐述 在 该 协议 中 关于 底层 端 到 端 运输 服务 所 做 
的 假设 。 


- 式 (1-1) 给 出 了 经 传输 速率 为 及 的 N 段 链 路 发 送 长 度 L 的 一 个 分 组 的 端 到 端 时 延 。 对 于 经 过 NN 段 链 


路 一 个 接 一 个 地 发 送 P 个 这 样 的 分 组 ,一般 化 地 表示 出 这 个 公式 。 


. 考虑 一 个 应 用 程序 以 稳定 的 速率 传输 数据 (例如 ， 发 送 方 每 个 时 间 单 元 产生 一 个 N 比特 的 数据 单 


元 ,其 中 较 小 且 固 定 )。 另 外 ， 当 这 个 应 用 程序 启动 时 ， 它 将 连续 运行 相当 长 的 一 段 时 间 。 回 答 下 

列 问题 ， 简 要 论证 你 的 回答 : 

a. 是 分 组 交换 网 还 是 电路 交换 网 更 为 适合 这 种 应 用 ? 为 什么 ? 

b. 假定 使 用 了 分 组 交换 网 ， 并 且 该 网 中 的 所 有 流量 都 来 自如 上 所 述 的 这 种 应 用 程序 。 此 外 ,假定 该 
应 用 程序 数据 传输 速率 的 总 和 小 于 每 条 链 路 的 各 自 容 量 。 需 要 某 种 形式 的 拥塞 控制 吗 ? 为 什么 ? 

考虑 在 图 1-13 中 的 电路 交换 网 。 回 想 在 每 条 链 路 上 有 4 条 链 路 ， 以 顺 时 针 方向 标记 四 台 交 换 机 A、 
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B、C 和 D。 

a. 在 该 网 络 中 ,任何 时 候 能 够 进行 同时 连接 的 最 大 数量 是 多 少 ? 

b. 假定 所 有 连接 位 于 交换 机 A 和 C 之 间 。 能 够 进行 同时 连接 的 最 大 数量 是 多 少 ? 

c. 假定 我 们 要 在 交换 机 A 和 C 之 间 建 立 4 条 连接 ， 在 交换 机 B 和 D 之 间 建 立 男 外 4 条 连接 。 我 们 能 
够 让 这 些 呼叫 通过 这 4 条 链 路 建立 路 由 以 容纳 所 有 8 条 连接 吗 ? 

. 回顾 在 1.4 节 中 的 车 队 的 类 比 。 假 定 传播 速度 为 100km/h。 

a. 假定 车 队 旅行 150km: 在 一 个 收费 站 前 面 开 始 ， 通 过 第 二 个 收费 站 ， 并 且 正 好 在 第 三 个 收费 站 后 
面 结束 。 其 端 到 端 时 延 是 多 少 ? 
b. 重复 (a) ， 现 在 假定 车 队 中 有 8 辆 汽车 而 不 是 10 辆 。 

. 这 个 习题 开始 探讨 传播 时 延 和 传输 时 延 ， 这 是 数据 网 络 中 的 两 个 重要 概念 。 考 虑 两 台 主机 A 和 B 由 
一 条 速率 为 R bps 的 链 路 相连 。 假 定 这 两 台 主 机 相隔 m 米 ， 沿 该 链 路 的 传播 速率 为 m/s。 主 机 A 向 
主机 B 发 送 长 度 工 比 特 的 分 组 。 

a. JH m Alls 来 表示 传播 时 延 do。 

b. 用 工 和 RR 来 确定 该 分 组 的 传输 时 间 dans 0 

c 忽略 处 理 和 排队 时 延 ， 得 出 端 到 端 时 延 的 表达 式 。 

d. 假定 主机 A 在 时 刻 :=0 开始 传输 该 分 组 。 在 时 刻 上 = qd ， 该 分 组 的 最 后 一 个 比特 在 什么 地 方 ? 
e. 假定 di 大 于 ds。 在 时 刻 1= dss， 该 分 组 的 第 一 个 比特 在 何 处 ? 

f 假定 dj 小 于 ds。 在 时 刻 1= wu， 该 分 组 的 第 一 个 比特 在 何 处 ? 

g 假定 ;=2.5 «10°, L=120 比特 ，R =56kbps。 求 出 使 dw, 等 于 do。 的 距离 mo 

. 在 这 个 习题 中 ,我 们 考虑 从 主机 A 向 主机 B 通过 分 组 交换 网 发 送 语音 (VolP)。 主 机 A 将 模拟 语音 
转换 为 传输 中 的 64kbps 数字 比特 流 。 然 后 主机 A 将 这 些 比 特 分 为 56 字 节 的 分 组 。A 和 B 之 间 有 一 条 
链 路 : 它 的 传输 速率 是 2Mbps， 传 播 时 延 是 10ms, 一旦 A 收集 了 一 个 分 组 ， 就 将 它 向 主机 B 发 送 。 
一 旦 主机 B 接收 到 一 个 完整 的 分 组 ， 它 将 该 分 组 的 比特 转换 成 模拟 信号 。 从 比特 产生 (从 位 于 主机 
A 的 初始 模拟 信号 起 ) 的 时 刻 起 ， 到 该 比特 被 解码 (在 主机 B 上 作为 模拟 信号 的 一 部 分 ) ， 花 了 多 少 
时 间 ? 

. 假定 用 户 共享 一 条 3Mbps 的 链 路 。 又 设 每 个 用 户 传输 时 要 求 130kbps， 但 是 每 个 用 户 仅 有 10% 的 时 间 
传输 。( 参 见 1. 3 节 中 关于 “分 组 交换 与 电路 交换 的 对 比 ”的 讨论 。) 

a 当 使 用 电路 交换 时 ， 能 够 支持 多 少 用 户 ? 

b. 对 于 本 习题 的 后 续 小 题 ， 假 定 使 用 分 组 交换 。 求 出 某 给 定 用 户 正在 传输 的 概率 。 

c. 假定 有 120 个 用 户 。 求 出 在 任何 给 定时 刻 ， 实 际 有 个 用 户 在 同时 传输 的 概率 。( 提示: 使 用 二 项 
式 分 布 。) 

d 求 出 有 21 个 或 更 多 用 户 同时 传输 的 概率 。 

. 考虑 在 1.3 节 “ 分 组 交换 与 电路 交换 的 对 比 ” 的 讨论 中 ,给 出 了 一 个 具有 一 条 1Mbps 链 路 的 例子 。 
用 户 在 忙 时 以 100kbps 速率 产生 数据 ， 但 忙 时 仅 以 p=0. 1 的 概率 产生 数据 。 假 定 用 1Gbps 链 路 替代 
1 Mbps 的 链 路 。 

a. 当 采 用 电路 交换 技术 时 ， 能 被 同时 支持 的 最 大 用 户 数 量 N 是 多 少 ? 
b. 现在 考虑 分 组 交换 和 有 M 个 用 户 的 情况 。 给 出 多 于 NN 用 户 发 送 数据 的 概率 公式 p M, N 
表示 )。 

P10. 考虑 一 个 长 度 为 工 的 分 组 从 端 系统 A 开始 ， 经 3 段 链 路 传送 到 目的 端 系统 。 令 da s; AR, 表示 链 路 

i 的 长 度 、 传 播 速 度 和 传输 速率 (i=1，2，3)。 该 分 组 交换 机 对 每 个 分 组 的 时 延 为 d,,,。。 假 定 没 有 

排队 时 延 ， 用 di, s R(i=1, 2, 3) 和 工 表示 ， 该 分 组 总 的 端 到 端 时 延 是 什么 ? 现在 假定 该 分 组 

是 1500 FH, 在 所 有 3 条 链 路 上 的 传播 时 延 是 2.5 x 10"m/s， 所 有 3 条 链 路 的 传输 速率 是 2Mbps， 

分 组 交换 机 的 处 理 时 延 是 3ms， 第 一 段 链 路 的 长 度 是 5000km， 第 二 段 链 路 的 长 度 是 4000km， 并 且 

最 后 一 段 链 路 的 长 度 是 1000km。 对 于 这 些 值 ， 该 端 到 端 时 延 为 多 少 ? 

Pll. 在 上 述 习 题 中 , (ER, =R, =R =R Ad, =0。 进 一 步 假定 该 分 组 交换 机 不 存储 转发 分 组 ， 而 是 
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P12. 


P13. 


P14. 


PIS: 


P16. 


Pry. 


P18. 


P19. 


P20. 


P21. 


P22. 





在 等 待 分 组 到 达 前 立即 传输 它 收 到 的 每 个 比特 。 这 时 端 到 端 时 延 为 多 少 ? 

一 台 分 组 交换 机 接收 一 个 分 组 并 决定 该 分 组 应 当 转 发 的 出 链 路 。 当 某 分 组 到 达 时 ， 另 一 个 分 组 正在 

该 出 链 路 上 被 发 送 到 一 半 ， 还 有 4 个 其 他 分 组 正 等 竺 传输。 这些 分 组 以 到 达 的 次 序 传输 。 假 定 所 有 

分 组 是 1500 字 节 并 且 链 路 速率 是 2Mbps。 该 分 组 的 排队 时 延 是 多 少 ? 在 更 一 般 的 情况 下 ， 当 所 有 分 

组 的 长 度 是 L， 传 输 速率 是 尺 ， 当 前 正在 传输 的 分 组 已 经 传输 了 x 比特 ,并且 已 经 在 队列 中 有 nn 个 

分 组 ， 其 排队 时 延 是 多 少 ? 

a. 假定 及 个 分 组 同时 到 达 一 条 当前 没有 分 组 传输 或 排队 的 链 路 。 每 个 分 组 长 为 L， 链 路 传输 速率 

为 R。 对 NN 个 分 组 而 言 ， 其 平均 排队 时 延 是 多 少 ? 

b. 现在 假定 每 隔 LN/R BPA ON 个 分 组 同时 到 达 链 路 。 一 个 分 组 的 平均 排队 时 延 是 多 少 ? 

考虑 某 路 由 器 缓存 中 的 排队 时 延 。 令 了 表示 流量 强度 ; 即 1= La/R。 假定 排队 时 延 的 形式 为 IL/R 

(1 二 ,其 中 I<1。 

a. 写 出 总 时 延 妈 排队 时 延 加 上 传输 时 延 的 公式 。 

b. 以 LVR 为 函数 画 出 总 时 延 的 图 。 

S a 表示 在 一 条 链 路 上 分 组 的 到 达 率 ( 以 分 组 / 秒 计 )， 令 多 表 示 一 条 链 路 上 分 组 的 传输 率 ( 以 分 

组 / 秒 计 ) 。 基 于 上 述 习题 中 推导 出 的 总 时 延 公 式 〈 即 排队 时 延 加 传输 时 延 ) ， 推 导出 以 入 表示 

的 总 时 延 公 式 。 

考虑 一 台 路 由 器 缓存 前 面 的 一 条 出 链 路 。 在 这 个 习题 中 ， 将 使 用 李 特 尔 (Litle) 公式 ， 这 是 排队 论 

中 的 一 个 著名 公式 。 令 N 表示 在 缓存 中 的 分 组 加 上 被 传输 的 分 组 的 平均 数 。 令 a 表示 到 达 该 链 路 的 

分 组 速率 。 令 d 表示 一 个 分 组 历经 的 平均 总 时 延 ( 即 排队 时 延 加 传输 时 延 )。 李 特 尔 公式 是 N=a x 

d。 假 定 该 缓存 平均 包含 10 个 分 组 ， 并且 平均 分 组 排队 时 延 是 10ms。 该 链 路 的 传输 速率 是 100 分 

组 / 秒 。 使 用 李 特 尔 公式 ， 在 没有 丢 包 的 情况 下 ， 平均 分 组 到 达 率 是 多 少 ? 

a 对 于 不 同 的 处 理 速率 、 传 输 速 率 和 传播 时 延 ， 给 出 1.4.3 节 中 式 (1-2) 的 一 般 表 达 式 。 

b. 重复 (a) ， 不 过 此 时 假定 在 每 个 节点 有 平均 排队 时 延 Coe。 

在 一 天 的 3 个 不 同 的 小 时 内 ， 在 同一 个 大 陆 上 的 源 和 目的 地 之 间 执 行 Traceroute, 

a. 在 这 3 个 小 时 的 每 个 小 时 中 ， 求 出 往返 时 延 的 均值 和 方差 。 

b. 在 这 3 个 小 时 的 每 个 小 时 中 ， 求 出 路 径 上 的 路 由 器 数量 。 在 这 些 时 段 中 ， 该 路 径 发 生变 化 了 吗 ? 

c 试图 根据 源 到 目的 地 Traceroute 分 组 通过 的 情况 ， 辨 明 ISP 网 络 的 数量 。 具 有 类 似 名 字 和 /或 类 似 
的 全 地 址 的 路 由 器 应 当 被 认为 是 同一 个 ISP 的 一 部 分 。 在 你 的 实验 中 ,在 相 邻 的 ISP 间 的 对 等 接 
口 处 出 现 最 大 的 时 延 了 吗 ? 

d. 对 位 于 不 同 大 陆 上 的 源 和 目的 地 重复 上 述 内 容 。 比 较 大 陆 内 部 和 大 陆 之 间 的 这 些 结果 。 

a. 访问 站 点 www. traceroute. org， 并 从 法 国 两 个 不 同 的 城市 向 位 于 美国 的 相同 的 目的 主机 执行 Tracer- 
outes, 在 这 两 个 Traceroute 中 ， 有 多 少 条 链 路 是 相同 的 ? 大 西洋 沿岸 国家 的 链 路 相同 吗 ? 

b 重复 (a), ， 但 此 时 选择 位 于 法 国 的 一 个 城市 和 位 于 德国 的 另 一 个 城市 。 

c -在 美国 挑选 一 个 城市 ， 然 后 向 位 于 中 国 的 两 个 不 同城 市 的 主机 执行 Traceroute。 在 这 两 次 Tracer- 
oute 中 有 多 少 链 路 是 相同 的 ? 在 到 达 中国 前 这 两 个 Traceroute 分 开 了 吗 ? 

考虑 对 应 于 图 1-20b 吞吐 量 的 例子 。 现 在 假定 有 对 客户 -服务 器 而 不 是 10 对 。 用 R,、R。 AR AD 

别 表示 服务 器 链 路 、 客 户 链 路 和 网 络 链 路 的 速率 。 假 设 所 有 的 其 他 链 路 都 有 充足 容量 ， 并 且 除 了 由 

这 M 对 客户 -服务 器 产生 的 流量 外 ， 网 络 中 没有 其 他 流量 。 推 导出 由 R,、R.、R 和 M 表示 的 通用 

吞吐 量 表达 式 。 

考虑 图 1-19b。 现 在 假定 在 服务 器 和 客户 之 间 有 M 条 路 径 。 任 两 条 路 径 都 不 共享 任何 链 路 。 路 径 

k(k=1, =, M) WIERA Ri, Ri, =, Ry 的 入 条 链 路 组 成 。 如 果 服 务 器 仅 能 够 使 用 一 条 路 径 

向 客户 发 送 数据 ， 则 该 服务 器 能 够 取得 的 最 大 吞吐 量 是 多 少 ? 如 果 该 服务 器 能 够 使 用 所 有 M 条 路 径 

发 送 数 据 ， 则 该 服务 器 能 够 取得 的 最 大 吞吐 量 是 多 少 ? 

考虑 图 1-19b。 假定 服务 器 与 客户 之 间 的 每 条 链 路 的 丢 包 概率 为 p， 且 这 些 链 路 的 丢 包 率 是 独立 的 。 

一 个 (由 服务 器 发 送 的 ) 分 组 成 功 地 被 接收 方 收 到 的 概率 是 多 少 ? 如 果 在 从 服务 器 到 客户 的 路 径 上 
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分 组 丢失 了 ， 则 服务 器 将 重 传 该 分 组 。 平 均 来 说 ， 为 了 使 客户 成 功 地 接收 该 分 组 ， 服 务 器 将 要 重 传 

该 分 组 多 少 次 ? 

考虑 图 1-19a。 假 定 我 们 知道 沿 着 从 服务 器 到 客户 的 路 径 的 瓶颈 链 路 是 速率 为 R, bps 的 第 一 段 链 路 。 

假定 我 们 从 服务 器 向 客户 发 送 紧密 相连 的 一 对 分 组 ， 且 沿 这 条 路 径 没有 其 他 流量 。 假 定 每 个 分 组 的 

长 度 为 工 比特 ， 两 条 链 路 具有 相同 的 传播 时 延 dr。 

a 在 目的 地 ， 分 组 的 到 达 间 隔 时 间 有 多 大 ? 也 就 是 说 ， 从 第 一 个 分 组 的 最 后 一 个 比特 到 达到 第 二 个 
分 组 最 后 一 个 比特 到 达 所 经 过 的 时 间 有 多 长 ? 

b 现在 假定 第 二 段 链 路 是 瓶颈 链 路 〈 即 R, < R,)。 第 二 个 分 组 在 第 二 段 链 路 输入 队列 中 排队 是 可 能 
的 吗 ? 请 解释 原因 。 现 在 假定 服务 器 在 发 送 第 一 个 分 组 7 了 秒 之 后 再 发 送 第 二 个 分 组 。 为 确保 在 第 
二 段 链 路 之 前 没有 排队 ，7 必须 要 有 多 长 ? 试 解释 原因 。 


. 假设 你 希望 从 波士顿 向 洛杉矶 紧急 传送 40 x 10” 字 节 数 据 。 你 有 一 条 100Mbps 专用 链 路 可 用 于 传 


输 数据 。 你 是 愿意 通过 这 条 链 路 传输 数据 ， 还 是 愿意 使 用 FedEx 夜间 快递 来 交付 ? 解释 你 的 

理由 。 

假定 两 台 主机 A 和 B 相隔 20000km， 由 一 条 直接 的 R=2Mbps 的 链 路 相连 。 假 定 跨越 该 链 路 的 传播 

速率 是 2.5 x 10°m/s, 

a 计算 带宽 -时 延 积 R: top 

b. 考虑 从 主机 A 到 主机 B 发 送 一 个 800 000 比特 的 文件 。 假 定 该 文件 作为 一 个 大 的 报 文 连续 发 送 。 
在 任何 给 定 的 时 间 ， 在 链 路 上 具有 的 比特 数量 最 大 值 是 多 少 ? 

c. 给 出 带宽 -时 延 积 的 一 种 解释 。 

d 在 该 链 路 上 一 个 比特 的 宽度 (OKH) 是 多 少 ? 它 比 一 个 足球 场 更 长 吗 ? 

e. 用 传播 速率 *、 带 宽 R AIEEE m 的 长 度 表示 ， 推 导出 一 个 比特 宽度 的 一 般 表示 式 。 

对 于 习题 P25， 假 定 我 们 能 够 修改 R。 对 什么 样 的 R 值 ， 一 个 比特 的 宽度 能 与 该 链 路 的 长 度 一 样 长 ? 

考虑 习题 P25， 但 此 时 链 路 的 速率 是 R=1Gbps。 

a. 计算 带宽 -时 延 积 R. d,。 

b. 考虑 从 主机 A 到 主机 B 发 送 一 个 800 000 比特 的 文件 。 假 定 该 文件 作为 一 个 大 的 报 文 连续 发 送 。 
在 任何 给 定 的 时 间 ， 在 链 路 上 具有 的 比特 数量 最 大 值 是 多 少 ? 

c 在 该 链 路 上 一 个 比特 的 宽度 (以 米 计 ) 是 多 少 ? 

再 次 考虑 习题 P25。 

a 假定 连续 发 送 ， 发 送 该 文件 需要 多 长 时 间 ? 

b. 假定 现在 该 文件 被 划分 为 20 个 分 组 ， 每 个 分 组 包含 40 000 比特 。 假 定 每 个 分 组 被 接收 方 确认 ， 
确认 分 组 的 传输 时 间 可 忽略 不 计 。 最 后 ， 假 定 前 一 个 分 组 被 确认 后 ， 发 送 方才 能 发 送 分 组 。 发 送 
该 文件 需要 多 长 时 间 ? 

c 比较 (a) 和 (b) 的 结果 。 

假定 在 同步 卫星 和 它 的 地 球 基站 之 间 有 一 条 10Mbps 的 微波 链 路 。 每 分 钟 该 卫星 拍摄 一 幅 数字 照片 ， 

并 将 它 发 送 到 基站 。 假 定 传播 速率 是 2. 4 x 10°m/s. 

a. 该 链 路 的 传播 时 延 是 多 少 ? 

b. 带宽 -时 延 积 R .ds 是 多 少 ? 

o 若 * 表示 该 照片 的 大 小 。 对 于 这 条 微波 链 路 ， 能 够 连续 传输 的 x 最 小 值 是 多 少 ? 

考虑 1.5 节 中 我 们 在 分 层 讨论 中 对 航空 旅行 的 类 比 ， 随 着 协议 数据 单元 向 协议 栈 底层 流动 ， 首 部 在 

增加 。 随 着 旅客 和 行李 移动 到 航线 协议 栈 底部 ， 有 与 上 述 首部 信息 等 价 的 概念 吗 ? 

在 包括 因特网 的 现代 分 组 交换 网 中 ， 源 主机 将 长 应 用 层 报 文 (如 一 个 图 像 或 音乐 文件 ) 分 段 为 较 小 

的 分 组 并 向 网 络 发 送 。 接 收 方 则 将 这 些 分 组 重新 装配 为 初始 报 文 。 我 们 称 这 个 过 程 为 报 文 分 段 。 

图 1-27 显示 了 一 个 报 文 在 报 文 不 分 段 或 报 文 分 段 情 况 下 的 端 到 端 传输 。 考 虑 一 个 长 度 为 8 x105 比 

特 的 报 文 ， 它 在 图 1-27 中 从 源 发 送 到 目的 地 。 假 定 在 该 图 中 的 每 段 链 路 是 2Mbps。 忽 略 传播 、 排 队 

和 处 理 时 延 。 
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源 分 组 交换 机 分 组 交换 机 目的 地 
a) 没有 报 文 分 段 





源 分 组 交换 机 分 组 交换 机 目的 地 
b) 有 报 文 分 段 


图 1-27 端 到 端 报 文 传输 


a 考虑 从 源 到 目的 地 发 送 该 报 文 且 没 有 报 文 分 段 。 从 源 主机 到 第 一 台 分 组 交换 机 移动 报 文 需要 多 长 
时 间 ? 记 住 ， 每 台 交 换 机 均 使 用 存储 转发 分 组 交换 ， 从 源 主 机 移动 该 报 文 到 目的 主机 需要 多 长 
时 间 ? 
b. 现在 假定 该 报 文 被 分 段 为 800 个 分 组 ， 每 个 分 组 10 000 比特 长 。 从 源 主机 移动 第 一 个 分 组 到 第 一 
台 交 换 机 需要 多 长 时 间 ? 从 第 一 台 交换 机 发 送 第 一 个 分 组 到 第 二 台 交 换 机 ， 从 源 主 机 发 送 第 二 个 
分 组 到 第 一 台 交换 机 各 需要 多 长 时 间 ? 什么 时 候 第 二 个 分 组 能 被 第 一 台 交换 机 全 部 收 到 ? 
c， 当 进行 报 文 分 段 时 ， 从 源 主 机 向 目的 主机 移动 该 文件 需要 多 长 时 间 ? 将 该 结果 与 (a) 的 答案 进 
行 比较 并 解释 之 。 
d. 除了 减 小 时 延 外 ， 使 用 报 文 分 段 还 有 什么 原因 ? 
e. 讨论 报 文 分 段 的 缺点 。 
P32. 用 本 书 的 Web 网 站 上 的 报 文 分 段 小 Java 小 程序 进行 实验 。 该 Java 程序 中 的 时 延 与 前 一 个 习题 中 的 
时 延 相 当 吗 ? 链 路 传播 时 延 是 怎样 影响 分 组 交换 (有 报 文 分 段 ) 和 报 文 交换 的 端 到 端 总 时 延 的 ? 
P33. 考虑 从 主机 A 到 主机 B 发 送 一 个 比特 的 大 文件 。A 和 B 之 间 有 三 段 链 路 〈 和 两 台 交换 机 ) ， 并 且 
该 链 路 不 拥塞 〈 即 没有 排队 时 延 ) 。 主 机 A 将 该 文件 分 为 每 个 为 5 比特 的 报 文 段 ， 并 为 每 个 报 文 段 
增加 一 个 80 比特 的 首部 ， 形 成 L=80 +S 比特 的 分 组 。 每 条 链 路 的 传输 速率 为 Rbps。 求 出 从 A 到 B 
移动 该 文件 时 延 最 小 的 值 S$。 忽 略 传播 时 延 。 

P34. Skype 提供 了 一 种 服务 ,使 你 能 用 PC 向 普通 电话 打 电 话 。 这 意味 着 语音 呼叫 必须 通过 因特网 和 电话 

网 。 讨 论 这 是 如 何 做 到 的 。 


ii Wireshark 实验 


“RMAF, HZRFRAZ, RAKSHA, Rž.” 
— ¥ BBB 

一 个 人 通常 能 够 通过 以 下 方法 加 深 对 网 络 协议 的 理解 : 观察 它们 的 动作 和 经 常 摆弄 它们 ， 即 观察 两 
个 协议 实体 之 间 交 换 的 报 文 序列 ， 人 钻研 协议 运行 的 细节 ， 使 协议 执行 某 些 动作 ， 观 察 这 些 动作 及 其 后 果 。 
这 能 够 在 仿真 环境 下 或 在 如 因特网 这 样 的 真实 网 络 环境 下 完成 。 在 本 书 配套 Web 站 点 上 的 Java 小 程序 采 
用 的 是 第 一 种 方法 。 在 Wireshark 实验 中 ， 我 们 将 采用 后 一 种 方法 。 你 可 以 在 家 中 或 实验 室 中 使 用 桌面 计 
算 机 在 各 种 情况 下 运行 网 络 应 用 程序 。 在 你 的 计算 机 上 观察 网 络 协 议 ， 它 是 如 何 与 在 因特网 别处 执行 的 
协议 实体 交互 和 交换 报 文 的 。 因 此 ， 你 与 你 的 计算 机 将 是 这 些 真 实 实验 的 有 机 组 成 部 分 。 你 将 通过 动手 
来 观察 和 学 习 。 

用 来 观察 执行 协议 实体 之 间 交 换 的 报 文 的 基本 工具 称 为 分 组 嗅 探 器 (packet sniffer) 。 顾 名 思 义 ， 一 
个 分 组 嗅 探 器 被 动 地 拷贝 ( 嗅 探 ) 由 你 的 计算 机 发 送 和 接收 的 报 文 ; 它 也 能 显示 出 这 些 被 捕获 报 文 的 各 
个 协议 字段 的 内 容 。 图 1-28 中 显示 了 Wireshark 分 组 嗅 探 器 的 屏幕 快照 。Wireshark 是 一 个 运行 在 Win- 
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dows, Linux/Unix 和 Mac 计算 机 上 的 免费 分 组 嗅 探 器 。 贯 穿 全 书 ， 你 将 发 现 Wireshark 实验 能 让 你 探索 在 
该 章 中 学 习 的 一 些 协议 。 在 这 第 一 个 Wireshark 实验 中 ， 你 将 获得 并 安装 一 个 Wireshark 的 副本 ,访问 一 
个 Web 站 点 ， 捕 获 并 检查 在 你 的 Web 浏览 器 和 Web 服务 器 之 间 交 换 的 协议 报 文 。 


命令 菜单 + a 








所 选 定 分 DO 
组 首部 的 = ; 和 ai 9 (windows us wt Re Ett A re ial ere dies Gecko/20111103 Firefox/3.6.24 (.NET CLR 3.5.30729)\r\n 


细节 copt-ancoding: gripcaetisce\r\n 
-Encoding P ,deflararNn 
mre charsect “150-8859-1 ,utf-8; 90.7," 790, 7\r\n 
te 415\r\n 
Connection: keep-a} {vi e\r\n 








十 六 进 制 
和 ASCII 


格式 的 分 





图 1-28 一 个 Wireshark 屏幕 快照 (打印 的 Wireshark 屏幕 快照 得 到 了 Wireshark 基金 会 的 许可 ) 


你 能 够 在 Web 站 点 http://www. pearsonhighered. com/cs-resources/ 上 找到 有 关 该 第 一 个 Wireshark 实验 
的 全 部 材料 (包括 如 何 获得 并 安装 Wireshark 的 指导 ) 。 


人 物 专访 


Leonard Kleinrock 是 加 州 大 学 洛杉矶 分 校 (UCLA) 的 计算 机 科学 教 
授 。1969 年 ， 他 在 UCLA 的 计算 机 成 为 因特网 的 第 一 个 节点 。1961 年 ， 
他 创造 的 分 组 交换 原理 成 为 因特网 的 支撑 技术 。 他 在 纽约 城市 大 学 (City 
College of New York, CCNY) 获得 电气 工程 学 士 学 位 ， 并 在 麻 省 理工 学 院 
(MIT) 获得 电气 工程 硕士 和 博士 学 位 。 





© 是 什么 使 得 您 决定 专门 研究 网 络 /因特网 技术 的 ? 

HRF 1959 年 在 MIT 读 博 士 时 ， 我 发 现 周 围 的 大 多 数 同学 正在 信息 理论 
和 编码 理论 领域 做 研究 。 在 MIT， 那 时 有 伟大 的 研究 者 Claude Shannon， 他 已 
经 开创 这 些 领 域 ， 并 且 已 经 解决 了 许多 重要 的 问题 。 留 下 来 的 研究 问题 既 难 又 
不 太 重 要 。 因 此 我 决定 开始 新 的 研究 领域 ， 而 该 领域 其 他 人 还 没有 想到 。 回 想 那 时 在 MIT 我 的 周围 有 许 
多 计算 机 ， 我 很 清楚 很 快 这 些 计 算 机 将 有 相互 通信 的 需求 。 在 那 时 ， 却 没有 有 效 的 办 法 来 做 到 这 一 点 ， 
因此 我 决定 研发 能 够 创建 有 效 的 数据 网 络 的 技术 。 

。 您 在 计算 机 产业 的 第 一 份 工作 是 什么 ? 它 使 您 有 哪些 收益 ? 

1951 ~ 1957 Æ, 我 为 了 获得 电子 工程 学 士 学 位 在 CCNY 读 夜 大 。 在 那 段 时 间 里 , 我 在 一 家 称 为 
Photobell 的 工业 电子 小 公司 工作 ， 先 是 当 技术 员 ， 然 后 当 工程 师 。 在 那里 ， 我 在 它们 的 产品 线 上 引入 了 
数字 技术 。 我 们 主要 使 用 光电 子 设备 来 检测 某 些 物 体 (盒子 、 人 等 ) 的 存在 ， 一 种 称 为 双 稳 态 多 频 振荡 
器 的 电路 的 使 用 正 是 我 们 需要 的 技术 类 型 ， 它 能 将 数字 处 理 引 入 检测 领域 。 这 些 电 路 恰好 是 计算 机 的 基 
本 模块 ， 用 今天 的 话说 就 是 触发 电路 或 交换 器 。 

© 当 您 发 送 第 一 个 主机 到 主机 报 文 (从 UCLA 到 斯 坦 福 研究 院 ) 时 ， 您 心中 想到 了 什么 ? 





Leonard Kleinrock 
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坦率 地 说 ,我 们 当时 并 没有 想到 那 件 事 的 重要 性 。 我 们 没有 准备 具有 历史 意义 的 豪言壮语 ， 就 像 彰 
日 许多 发 明 家 所 做 的 那样 (UNE IR + 莫 尔 斯 的 “上 帝 创造 了 什么 (What hath God wrought)”， 亚 历 山 
K + 格 瑞 汉 姆 * 贝尔 的 “Watson 先生 ， 请 来 这 里 ! 我 想见 你 ”， 或 尼 尔 . 阿姆斯特朗 的 “个 人 的 一 小 步 ， 
人 类 的 一 大 步 " ) 。 多 么 聪明 的 人 哪 ! 他 们 明白 媒体 和 公众 的 关系 。 我 们 要 做 的 所 有 工作 是 向 斯 坦 福 研究 
院 的 计算 机 进行 注册 。 当 我 们 键入 “L”， 它 被 正确 收 到 ， 当 我 们 键入 “o” 又 被 正确 收 到 ， 而 当 我 们 键 
入 “g” 则 引起 斯 坦 福 研究 院 主机 的 崩溃 ! 因此 ， 这 将 我 们 的 报 文 转换 为 最 短 的 ， 也 许 是 最 有 预测 性 的 
报 文 ,“Lo!” 即 为 “ 真 想不到 (Lo and behold) !” , 

那 年 早 些 时 候 ，UCLA 新 闻 稿 引用 我 的 话说 ， 一 且 该 网 络 建立 并 运行 起 来 ， 将 可 能 从 我 们 的 家 中 和 
办 公 室 访问 计算 机 设施 ， 就 像 我们 获得 电力 和 电话 连接 那样 容易 。 因 此 那 时 我 的 美好 愿望 是 ， 因 特 网 将 
是 一 个 无 所 不 在 的 、 总 是 运行 的 、 总 是 可 用 的 网 络 ， 任 何人 从 任何 地 方 用 任何 设备 将 能 够 与 之 相连 ， 并 
且 它 将 是 不 可 见 的 。 然 而 ， 我 从 没有 期 待 我 的 99 岁 的 母亲 将 能 够 上 因特网 ， 但 她 的 确 做 到 了 这 一 点 。 

© 您 对 未 来 网 络 的 展望 是 什么 ? 

我 的 展望 中 最 容易 的 部 分 是 预测 基础 设施 本 身 。 我 预见 我 们 看 到 移动 计算 、 移 动 设备 和 智能 空间 的 
大 量 部 署 。 轻 量 级 、 廉 价 、 高 性 能 、 便 携 的 计算 和 通信 设备 〈 加 上 因特网 的 无 处 不 在 ) 的 确 使 我 们 成 为 
游牧 一 员 。 游 牧 计算 是 指使 从 一 个 地 方 旅行 到 另 一 个 地 方 的 端 用 户 ， 以 透明 方式 访问 因特网 服务 ， 无 论 
他 们 旅行 到 何 处 ， 无 论 他 们 携带 什么 设备 或 获得 何 种 接 人 。 展 望 中 最 困难 的 部 分 是 预测 应 用 和 服务 ， 它 
们 以 引 人 注 目的 方式 不 断 地 带 给 我 们 惊喜 (电子 邮件 、 搜 索 技术 、 万 维 网 、 博 客 、 社 交 网 络 、 用 户 一 代 
以 及 音乐 、 照 片 和 视频 等 的 共享 ) 。 我 们 正面 临 一 种 新 的 惊奇 和 创新 ， 即 移动 应 用 装载 于 手持 设备 中 。 

下 一 步 将 使 我 们 从 信息 空间 虚拟 世界 (netherworld) 移动 到 智能 空间 的 物理 世界 。 我们 的 环境 (办 
公 桌 、 墙 辟 、 和 车辆、 钟表 、 腰 带 等 ) 将 因 技术 而 棚 棚 如 生 ， 这 些 技术 包括 执行 器 (actuator) 、 传 感 器 、 
逻辑 、 处 理 、 存 储 、 照 相机 、 麦 克 风 、 话 简 、 显 示 器 和 通信 。 这 种 散人 式 技术 将 使 得 环境 能 提供 我 们 需 
要 的 IP 服务 。 当 我 走 进 一 间 房间 时 ， 该 房间 知道 我 的 到 来 。 我 将 能 够 与 环境 自然 地 通信 ， 如 同 说 英语 一 
样 ; 我 的 请 求 产生 的 响应 将 从 墙 上 的 显示 器 通过 我 的 眼镜 以 Web 网 页 的 形式 呈现 给 我 ， 就 像 说 话 、 全 息 
照相 等 一 样 。 

再 向 前 看 一 点 ， 我 看 到 未 来 的 网 络 包括 了 下 列 附 加 的 关键 组 件 。 我 看 到 在 网 络 各 处 部 署 的 智能 软件 
代理 ， 它 的 功能 是 挖掘 数据 ， 根 据 数据 采取 动作 ， 观 察 趋势 ， 并 能 动态 地 、 自 适应 地 执行 任务 。 我 看 到 
相当 多 的 网 络 流量 并 不 是 由 人 产生 的 ， 而 是 由 这 些 嵌 入 式 设备 和 这 些 智能 软件 代理 产生 的 。 我 看 到 大 批 
的 自 组 织 系统 控制 这 个 巨大 、 快 速 的 网 络 。 我 看 到 巨 量 的 信息 瞬间 通过 网 络 立即 得 到 强力 处 理 和 过 滤 。 
因特网 最 终 将 是 一 个 无 所 不 在 的 全 球 性 神经 系统 。 当 我 们 急速 在 21 世纪 进发 时 ， 我 将 看 到 这 些 东 西 和 更 
多 的 东西 。 

。 是 谁 激发 了 您 的 职业 灵感 ? 

到 目前 为 止 ,是 麻 省 理工 学 院 的 Claude Shannon。 他 是 一 名 卓越 的 研究 者 ， 具 有 以 高 度 直觉 的 方式 将 
他 的 数学 理念 与 物理 世界 关联 起 来 的 能 力 。 他 是 我 的 博士 论文 答辩 委员 会 的 成 员 。 

。 您 对 进入 网 络 / 因 特 网 领域 的 学 生 有 什么 忠告 吗 ? 

因特网 和 由 它 使 能 的 所 有 东西 是 一 个 巨大 的 新 前 沿 ， 充满 了 令 人 惊奇 的 挑战 ， 为 众多 创新 提供 了 广 
阔 空 间 。 不 要 受 今天 技术 的 束缚 ， 开 动 大 脑 ， 想 象 能 够 做 些 什么 ， 并 去 实现 它 。 
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网 络 应 用 是 计算 机 网 络 存在 的 理由 ， 如 果 我 们 不 能 构想 出 任何 有 用 的 应 用 ， 也 就 没有 
任何 必要 去 设计 支持 它们 的 网 络 协 议 了 。 自 因特网 全 面 发 展 以 来 ， 的 确 已 开发 出 众多 有 用 
的 、 有 趣 的 网 络 应 用 。 这 些 应 用 程序 已 经 成 为 因特网 成 功 的 驱动 力 ， 激 励 人 们 在 家 庭 、 学 
校 、 政 府 和 商业 中 利用 网 络 ， 使 因特网 成 为 他 们 日 常 活动 的 密 不 可 分 的 一 部 分 。 

因特网 应 用 包括 : 20 世纪 70 年 代 和 80 年 代 开始 流行 的 经 典 的 基于 文本 的 应 用 ， 如 文 
本 电子 邮件 、 远 程 访问 计算 机 、 文 件 传输 和 新 闻 组 ; 20 世纪 90 年 代 中 期 引入 的 招 人 喜爱 
的 应 用 一 一 万 维 网 ， 包 括 Web 冲浪 、 搜 索 和 电子 商务 ; 20 世纪 末 引 入 的 两 个 招 人 喜爱 的 
应 用 一 一 即时 讯息 和 对 等 (P2P) 文件 共享 。 自 2000 年 以 来 ,新 型 和 极其 引人入胜 的 应 用 
持续 出 现 ， 包 括 : IP 电话 (VoIP) 、 视 频 会 议 (如 Skype, Facetime 和 Google Hangouts) ; 
用 户 生 成 的 视频 (如 YouTube) 和 点 播 电影 (如 Netflix); 多 方 在 线 游戏 (如 《第 二 人 生 》 
(Second Life) 和 《魔兽 世界 》 (World of Warcraft) ) 。 在 这 段 时 期 ， 我 们 看 到 了 新 一 代 社 
交 网 络 应 用 ， 如 Facebook, Instagram, Twitter 和 微 信 ， 它 们 在 因特网 的 网 络 或 路 由 器 和 通 
信和 链 路 之 上 创建 了 引人入胜 的 人 类 网 络 。 近 年 来 ， 随 着 智能 手机 的 发 展 ， 出 现 了 大 量 基于 
位 置 的 移动 应 用 程序 ， 包 括 流行 的 签到 、 约 会 和 道路 流量 预测 应 用 (如 Yelp, Tinder, 
Waz 和 Yik Yak) 。 显 然 ， 新 型 和 令 人 兴奋 的 因特网 应 用 的 步伐 并 没有 减缓 。 也 许 本 书 的 一 
些 读 者 将 会 创建 下 一 代 招 人 喜爱 的 因特网 应 用 。 

在 本 章 中 ， 我 们 学 习 有 关 网 络 应 用 的 原理 和 实现 方面 的 知识 。 我 们 从 定义 关键 的 应 用 
层 概念 开始 ， 其 中 包括 应 用 程序 所 需要 的 网 络 服务 、 客 户 和 服务 器 、 进 程 和 运输 层 接口 。 
我 们 详细 考察 几 种 网 络 应 用 程序 ， 包 括 Web、 电 子 邮 件 、DNS、 对 等 文件 分 发 和 视频 流 
(第 9 章 关 注 多 媒体 应 用 ， 包 括 流 式 视频 和 VoIP ) 。 然 后 我 们 将 涉及 开发 运行 在 TCP 和 
UDP 上 的 网 络 应 用 程序 。 特 别 是 ， 我 们 学 习 套 接 字 接口 ， 并 浮光掠影 地 学 习 用 Python 语 
言 写 的 一 些 简单 的 客户 - 服务 器 应 用 程序 。 在 本 章 结尾 ， 我 们 也 将 提供 几 个 有 趣 、 有 意思 
的 套 接 字 编程 作业 。 

应 用 层 是 我 们 学 习 协 议 非 常 好 的 起 点 ， 它 最 为 我 们 所 熟悉 。 我 们 熟悉 的 很 多 应 用 就 是 
建立 在 这 些 将 要 学 习 的 协议 基础 上 的 。 通 过 对 应 用 层 的 学 习 ， 将 有 助 于 我 们 很 好 地 感受 到 
协议 的 方方面面 ， 将 使 我 们 了 解 到 很 多 问题 ， 这 些 问 题 在 我 们 学 习 运 输 层 、 网 络 层 及 数据 
链 路 层 协 议 时 也 同样 会 碰 到 。 


2.1 应 用 层 协议 原理 


假定 你 对 新 型 网 络 应 用 有 了 一 些 想 法 。 也 许 这 种 应 用 将 为 人 类 提供 一 种 伟大 的 服务 ， 
或 者 将 使 你 的 教授 高 兴 ， 或 者 将 带 给 你 大 量 的 财富 ， 或 者 只 是 在 开发 中 获得 乐趣 。 无 论 你 
的 动机 是 什么 ,我 们 现在 考察 一 下 如 何 将 你 的 想法 转变 为 一 种 真实 世界 的 网 络 应 用 。 

研发 网 络 应 用 程序 的 核心 是 写 出 能 够 运行 在 不 同 的 端 系统 和 通过 网 络 彼此 通信 的 程序 。 
例如 ， 在 Web 应 用 程序 中 ， 有 两 个 互相 通信 的 不 同 的 程序 : 一 个 是 运行 在 用 户主 机 (桌面 
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机 、 膝 上 机 、 平 板 电脑 、 智 能 电话 等 ) 上 的 浏览 器 程序 ， 男 一 个 是 运行 在 Web 服务 器 主机 
上 的 Web 服务 器 程序 。 另 一 个 例子 是 P2P 文件 共享 系统 ， 在 参与 文件 共享 的 社区 中 的 每 台 
主机 中 都 有 一 个 程序 。 在 这 种 情况 下 ， 在 各 人 台 主 机 中 的 这 些 程序 可 能 都 是 类 似 的 或 相同 的 。 

因此 ， 当 研发 新 应 用 程序 时 ， 你 需要 编写 将 在 多 台 端 系统 上 运行 的 软件 。 该 软件 能 够 用 
如 C、Java 或 Python 来 编写 。 重 要 的 是 ， 你 不 需要 写 在 网 络 核心 设备 如 路 由 器 或 链 路 层 交 换 
机 上 运行 的 软件 。 即 使 你 要 为 网 络 核心 设备 写 应 用 程序 软件 ， 你 也 不 能 做 到 这 一 点 。 如 我 们 
在 第 1 章 所 知 ， 以 及 如 图 1-24 所 显示 的 那样 ， 网 络 核心 设备 并 不 在 应 用 层 上 起 作用 ， 而 仅 在 
较 低层 起 作用 ， 特 别 是 在 网 络 层 及 下 面 层 次 起 作用 。 这 种 基本 设计 ， 即 将 应 用 软件 限制 在 端 
系统 (如 图 2-1 所 示 ) 的 方法 ,促进 了 大 量 的 网 络 应 用 程序 的 迅速 研发 和 部 署 。 
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2-1 在 应 用 层 的 端 系统 之 间 的 网 络 应 用 的 通信 





2.1.1 网 络 应 用 程序 体系 结构 


当 进 行 软 件 编码 之 前 ， 应 当 对 应 用 程序 有 一 个 宽泛 的 体系 结构 计划 。 记 住 应 用 程序 的 
体系 结构 明显 不 同 于 网 络 的 体系 结构 (例如 在 第 1 章 中 所 讨论 的 5 层 因 特 网 体系 结构 )。 
从 应 用 程序 研发 者 的 角度 看 ， 网 络 体系 结构 是 固定 的 ， 并 为 应 用 程序 提供 了 特定 的 服务 集 





合 。 在 男 一 方面 ， 应 用 程序 体系 结构 (application architecture) 由 应 用 程序 研发 者 设计 ， 
规定 了 如 何在 各 种 端 系 统 上 组 织 该 应 用 程序 。 在 选择 应 用 程序 体系 结构 时 ， 应 用 程序 研发 
者 很 可 能 利用 现代 网 络 应 用 程序 中 所 使 用 的 两 种 主流 体系 结构 之 一 : 客户 - 服务 器 体系 结 
构 或 对 等 (P2P) 体系 结构 。 

在 客户 -服务 器 体系 结构 (client-server architecture) 中 ， 有 一 个 总 是 打开 的 主机 称 为 
服务 器 ， 它 服务 于 来 自 许多 其 他 称 为 客户 的 主机 的 请 求 。 一 个 典型 的 例子 是 Web 应 用 程 
序 ， 其 中 总 是 打开 的 Web 服务 器 服务 于 来 自 浏览 器 (运行 在 客户 主机 上 ) 的 请 求 。 当 
Web 服务 器 接收 到 来 自 某 客户 对 某 对 象 的 请 求 时 ， 它 向 该 客户 发 送 所 请 求 的 对 象 作为 响 
应 。 值 得 注意 的 是 利用 客户 -服务 器 体系 结构 ， 客 户 相 互 之 间 不 直接 通信 ; 例如 ,在 Web 
应 用 中 两 个 浏览 器 并 不 直接 通信 。 客 户 -服务 器 体系 结构 的 男 一 个 特征 是 该 服务 器 具有 固 
定 的 、 周 知 的 地 址 ,该 地 址 称 为 P 地 址 (我 们 将 很 快 讨论 它 )。 因 为 该 服务 器 具有 固定 
的 、 周 知 的 地 址 ， 并 且 因 为 该 服务 器 总 是 打开 的 ， 客 户 总 是 能 够 通过 向 该 服务 器 的 IP 地 
址 发 送 分 组 来 与 其 联系 。 具 有 客户 -服务 器 体系 结构 的 非常 著名 的 应 用 程序 包括 Web、 
FTP、Telnet 和 电子 邮件 。 图 2-2a 中 显示 了 这 种 客户 - 服务 器 体系 结构 。 





a) 客户 -服务 器 体系 结构 b) P2P 体 系 结构 
图 2-2 客户 - 服务 器 体系 结构 及 了 2P 体系 结构 


在 一 个 客户 - 服务 器 应 用 中 ， 常 常会 出 现 一 台 单 独 的 服务 器 主机 跟 不 上 它 所 有 客户 请 
求 的 情况 。 例 如 ， 一 个 流行 的 社交 网 络 站 点 如 果 仅 有 一 台 服 务 器 来 处 理 所 有 请 求 ， 将 很 快 
变 得 不 堪 重 负 。 为 此 ， 配 备 大 量 主机 的 数据 中 心 (data center) 常 被 用 于 创建 强大 的 虚拟 
服务 器 。 最 为 流行 的 因特网 服务 一 一 如 搜索 引擎 〈 如 谷歌 、Bing 和 百度 ) 、 因 特 网 商务 
(WW 3h, e-Bay 和 阿里 巴巴 ) 、 基 于 Web 的 电子 邮件 (如 Gmail 和 雅虎 邮件 )、 社 交 网 
络 (如 脸 书 、Instagram、 推 特 和 微 信 ) ， 就 应 用 了 一 个 或 多 个 数据 中 心 。 如 在 1. 3.3 节 中 
所 讨论 的 那样 ， 谷 歌 有 分 布 于 全 世界 的 30 ~50 个 数据 中 心 ， 这 些 数据 中 心 共同 处 理 搜索 、 
YouTube, Gmail 和 其 他 服务 。 一 个 数据 中 心 能 够 有 数 十 万 台 服 务 器 ， 它 们 必须 要 供电 和 维 
护 。 此 外 ， 服 务 提供 商 必 须 支付 不 断 出 现 的 互联 和 带宽 费用 ， 以 发 送 和 接收 到 达 / 来 自 数 
据 中 心 的 数据 。 
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在 一 个 P2P 体系 结构 (P2P architecture) 中 ， 对 位 于 数据 中 心 的 专用 服务 器 有 最 小 的 
(或 者 没有 ) 依赖 。 相 反 ， 应 用 程序 在 间断 连接 的 主机 对 之 间 使 用 直接 通信 ， 这 些 主机 对 
被 称 为 对 等 方 。 这 些 对 等 方 并 不 为 服务 提供 商 所 有 ， 相 反 却 为 用 户 控制 的 桌面 机 和 膝 上 机 
所 有 ， 大 多 数 对 等 方 驻 留 在 家 庭 、 大 学 和 办 公 室 。 因 为 这 种 对 等 方 通信 不 必 通 过 专门 的 服 
务 器 ， 该 体系 结构 被 称 为 对 等 方 到 对 等 方 的 。 许 多 目前 流行 的 、 流 量 密集 型 应 用 都 是 P2P 
体系 结构 的 。 这 些 应 用 包括 文件 共享 (例如 BitTorrent) 、 对 等 方 协助 下 载 加 速 器 (例如 迅 
雷 ) 、 因 特 网 电话 和 视频 会 议 〈 例 如 Skype). Al 2-2b 中 显示 了 P2P 的 体系 结构 。 需 要 提 
及 的 是 ， 某 些 应 用 具有 混合 的 体系 结构 ， 它 结合 了 客户 -服务 器 和 P2P 的 元 素 。 例 如 ， 对 
于 许多 即时 讯息 应 用 而 言 ， 服 务 器 被 用 于 跟踪 用 户 的 IP 地 址 ， 但 用 户 到 用 户 的 报 文 在 用 
户主 机 之 间 (AAG PIRSA) 直接 发 送 。 

P2P 体系 结构 的 最 引人入胜 的 特性 之 一 是 它们 的 自 扩展 性 (self- scalability ) 。 例 如 ， 
在 一 个 P2P 文件 共享 应 用 中 ， 尽 管 每 个 对 等 方 都 由 于 请 求 文件 产生 工作 负载 ， 但 每 个 对 等 
方 通过 向 其 他 对 等 方 分 发 文件 也 为 系统 增加 服务 能 力 。P2P 体系 结构 也 是 有 成 本 效率 的 ， 
因为 它们 通常 不 需要 庞大 的 服务 器 基础 设施 和 服务 器 带宽 (这 与 具有 数据 中 心 的 客户 - 服 
务 器 设计 形成 鲜明 对 比 ) 。 然 而 ， 未 来 P2P 应 用 由 于 高 度 非 集中 式 结构 ， 面 临安 全 性 、 人 性 
能 和 可 靠 性 等 挑战 。 


2. 1.2 进程 通信 


在 构建 网 络 应 用 程序 前 ， 还 需要 对 运行 在 多 个 端 系 统 上 的 程序 是 如 何 互相 通信 的 情况 
有 一 个 基本 了 解 。 用 操作 系统 的 术语 来 说 ， 进 行 通信 的 实际 上 是 进程 (process) 而 不 是 程 
序 。 一 个 进程 可 以 被 认为 是 运行 在 端 系统 中 的 一 个 程序 。 当 多 个 进程 运行 在 相同 的 端 系统 
上 时 ， 它 们 使 用 进程 间 通 信 机 制 相互 通信 。 进 程 间 通信 的 规则 由 端 系统 上 的 操作 系统 确 
定 。 而 在 本 书 中 ， 我 们 并 不 特别 关注 同一 台 主 机 上 的 进程 间 的 通信 ， 而 关注 运行 在 不 同 端 
系统 ( 可 能 具有 不 同 的 操作 系统 ) 上 的 进程 间 的 通信 。 

在 两 个 不 同 端 系 统 上 的 进程 ， 通 过 跨越 计算 机 网 络 交 换 报 文 (message) 而 相互 通信 。 
发 送 进程 生成 并 向 网 络 中 发 送 报 文 ; 接收 进程 接收 这 些 报 文 并 可 能 通过 回 送 报 文 进行 响 
应 。 图 2-1 显示 了 驻 留 在 5 层 协 议 栈 的 应 用 层 进 程 互相 通信 的 情况 。 

1. 客户 和 服务 器 进程 

网 络 应 用 程序 由 成 对 的 进程 组 成 ， 这 些 进程 通过 网 络 相互 发 送 报 文 。 例 如 ， 在 Web 
应 用 程序 中 ， 一 个 客户 浏览 器 进程 与 一 台 Web 服务 器 进程 交换 报 文 。 在 一 个 P2P 文件 共 
享 系统 中 ， 文 件 从 一 个 对 等 方 中 的 进程 传输 到 另 一 个 对 等 方 中 的 进程 。 对 每 对 通信 进程 ， 
我 们 通常 将 这 两 个 进程 之 一 标识 为 客户 (client) ， 而 男 一 个 进程 标识 为 服务 器 (server). 
对 于 Web 而 言 ， 浏 览 器 是 一 个 客户 进程 ，Web 服务 器 是 一 台 服 务 器 进程 。 对 于 P2P 文件 
共享 ， 下 载 文件 的 对 等 方 标识 为 客户 ， 上 载 文件 的 对 等 方 标识 为 服务 器 。 

你 或 许 已 经 观察 到 ， 如 在 P2P 文件 共享 的 某 些 应 用 中 ， 一 个 进程 能 够 既是 客户 又 是 服 
Piko Æ P2P 文件 共享 系统 中 ， 一 个 进程 的 确 既 能 上 载 文件 又 能 下 载 文件 。 无 论 如 何 ， 在 
任何 给 定 的 一 对 进程 之 间 的 通信 会 话 场景 中 ， 我 们 仍 能 将 一 个 进程 标识 为 客户 ， 另 一 个 进 
程 标识 为 服务 器 。 我 们 定义 客户 和 服务 器 进程 如 下 : 

在 一 对 进程 之 间 的 通信 会 话 场景 中 ， 发 起 通信 ( 即 在 该 会 话 开始 时 发 起 与 其 

他 进程 的 联系 ) 的 进程 被 标识 为 客户 ， 在 会 话 开 始 时 等 待 联系 的 进程 是 服务 器 。 
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在 Web 中 ， 一 个 浏览 器 进程 向 一 台 Web 服务 器 进程 发 起 联系 ， 因 此 该 浏览 器 进程 是 
客户 ， 而 该 Web 服务 器 进程 是 服务 器 。 在 P2P 文件 共享 中 ， 当 对 等 方 A 请 求 对 等 方 B 发 
送 一 个 特定 的 文件 时 ， 在 这 个 特定 的 通信 会 话 中 对 等 方 A 是 客户 ， 而 对 等 方 B 是 服务 器 。 
在 不 致 混淆 的 情况 下 ， 我们 有 时 也 使 用 术语 “应 用 程序 的 客户 端 和 服务 器 端 "。 在 本 章 的 
结尾 ， 我 们 将 逐步 讲解 网 络 应 用 程序 的 客户 端 和 服务 器 端的 简单 代码 。 

2. 进程 与 计算 机 网 络 之 间 的 接口 

如 上 所 述 ， 多 数 应 用 程序 是 由 通信 进程 对 组 成 ， 每 对 中 的 两 个 进程 互相 发 送 报 文 。 从 
一 个 进程 向 另 一 个 进程 发 送 的 报 文 必须 通过 下 面 的 网 络 。 进 程 通 过 一 个 称 为 套 接 字 ( sock- 
et) 的 软件 接口 向 网 络 发 送 报 文 和 从 网 络 接收 报 文 。 我 们 考虑 一 个 类 比 来 帮助 我 们 理解 进 
程 和 套 接 字 。 进 程 可 类 比 于 一 座 房子 ， 而 它 的 套 接 字 可 以 类 比 于 它 的 门 。 当 一 个 进程 想 向 
位 于 另外 一 台 主 机 上 的 另 一 个 进程 发 送 报 文 时 ， 它 把 报 文 推出 该 门 〈 套 接 字 ) 。 该 发 送 进 
程 假定 该 门 到 另外 一 侧 之 间 有 运输 的 基础 设施 ， 该 设施 将 把 报 文 传送 到 目的 进程 的 门口 。 
一 旦 该 报 文 抵达 目的 主机 ， 它 通过 接收 进程 的 门 ( 套 接 字 ) 传递 ， 然 后 接收 进程 对 该 报 文 
进行 处 理 。 

图 2-3 显示 了 两 个 经 过 因特网 通信 的 进程 之 间 的 套 接 字 通 信 (图 2-3 中 假定 由 该 进程 
使 用 的 下 面 运 输 层 协 议 是 因特网 的 TCP 协议 ) 。 如 该 图 所 示 ， 套 接 字 是 同一 台 主 机 内 应 用 
层 与 运输 层 之 间 的 接口 。 由 于 该 套 接 字 是 建立 网 络 应 用 程序 的 可 编程 接口 ， 因 此 套 接 字 也 
称 为 应 用 程序 和 网 络 之 间 的 应 用 程序 编程 接口 ( Application Programming Interface, API) 。 
应 用 程序 开发 者 可 以 控制 套 接 字 在 应 用 层 端的 一 切 ， 但 是 对 该 套 接 字 的 运输 层 端 几乎 没有 
控制 权 。 应 用 程序 开发 者 对 于 运输 层 的 控制 仅 限于 : QD 选择 运输 层 协 议 ; @@ 也 许 能 设 定 几 
个 运输 层 参 数 ， 如 最 大 缓存 和 最 大 报 文 段 长 度 等 (将 在 第 3 章 中 涉及 ) 。 一 旦 应 用 程序 开 
发 者 选择 了 一 个 运输 层 协议 (如果 可 供 选 择 的 话 ) ， 则 应 用 程序 就 建立 在 由 该 协议 提供 的 
运输 层 服务 之 上 。 我 们 将 在 2.7 节 中 对 套 接 字 进 行 更 为 详细 的 探讨 。 

3. 进程 寻 址 

为 了 向 特定 目的 地 发 送 邮政 邮件 ， 目 的 地 需要 有 一 个 地 址 。 类 似 地 ， 在 一 台 主 机 上 运 
行 的 进程 为 了 向 在 另 一 台 主 机 上 运行 的 进程 发 送 分 组 ， 接 收 进程 需要 有 一 个 地 址 。 为 了 标 
识 该 接收 进程 ， 需 要 定义 两 种 信息 : @ 主 机 的 地 址 ; @ 在 目的 主机 中 指定 接收 进程 的 标 
识 符 。 


主机 或 服务 器 主机 或 服务 器 


由 应 用 程序 开发 者 控制 





图 2-3 应 用 进程 、 套 接 字 和 下 面 的 运输 层 协 议 


A A & B 








在 因特网 中 ， 主 机 由 其 IP 地 址 (IP address) 标识 。 我 们 将 在 第 4 章 中 非常 详细 地 讨 
论 耻 地址。 此 时 ， 我 们 只 要 知道 卫 地 址 是 一 个 32 比特 的 量 且 它 能 够 唯一 地 标识 该 主机 就 
够 了 。 除 了 知道 报 文 发 送 目的 地 的 主机 地 址 外 ， 发 送 进程 还 必须 指定 运行 在 接收 主机 上 的 
接收 进程 (更 具体 地 说 ， 接 收 套 接 字 ) 。 因 为 一 般 而 言 一 台 主 机 能 够 运行 许多 网 络 应 用 ， 
这 些 信息 是 需要 的 。 目 的 地 端口 号 (port number) 用 于 这 个 目的 。 已 经 给 流行 的 应 用 分 配 
了 特定 的 端口 号 。 例 如 ，Web 服务 器 用 端口 号 80 来 标识 。 邮 件 服务 器 进程 (使 用 SMTP 
协议 ) 用 端口 号 25 来 标识 。 用 于 所 有 因特网 标准 协议 的 周知 端口 号 的 列表 能 够 在 hittp : // 
www. iana. org 处 找到 。 我 们 将 在 第 3 章 中 详细 学 习 端 口号 。 


2. 1.3 可 供应 用 程序 使 用 的 运输 服务 


前 面 讲 过 套 接 字 是 应 用 程序 进程 和 运输 层 协 议 之 间 的 接口 。 在 发 送 端的 应 用 程序 将 报 
文 推进 该 套 接 字 。 在 该 套 接 字 的 另 一 侧 ， 运 输 层 协议 负责 从 接收 进程 的 套 接 字 得 到 该 
报 文 。 

包括 因特网 在 内 的 很 多 网 络 提供 了 不 止 一 种 运输 层 协议 。 当 开发 一 个 应 用 时 ， 必 须 选 
择 一 种 可 用 的 运输 层 协 议 。 如 何 做 出 这 种 选择 呢 ? 最 可 能 的 方式 是 ， 通 过 研究 这 些 可 用 的 
运输 层 协 议 所 提供 的 服务 ， 选 择 一 个 最 能 为 你 的 应 用 需求 提供 恰当 服务 的 协议 。 这 种 情况 
类 似 于 在 两 个 城市 间 旅 行 时 选择 飞机 还 是 火车 作为 交通 工具 。 每 种 运输 模式 为 你 提供 不 同 
的 服务 ， 你 必须 选择 一 种 或 另 一 种 〈 例 如 ， 火 车 可 以 直到 市 区 上 客 和 下 客 ， 而 飞机 提供 了 
更 短 的 旅行 时 间 ) 。 

一 个 运输 层 协议 能 够 为 调用 它 的 应 用 程序 提供 什么 样 的 服务 呢 ? 我 们 大 体能 够 从 四 个 
方面 对 应 用 程序 服务 要 求 进行 分 类 : 可 靠 数据 传输 、 香 吐 量 、 定 时 和 安全 性 。 

1. 可 靠 数 据 传输 


如 第 1 章 讨 论 的 那样 ， 分 组 在 计算 机 网 络 中 可 能 丢失 。 例 如 ， 分 组 能 够 使 路 由 器 中 的 
缓存 溢出 ， 或 者 当 分 组 中 的 某 些 比 特 损坏 后 可 能 被 丢弃 。 像 电子 邮件 、 文 件 传输 、 远 程 主 
机 访问 、Web 文档 传输 以 及 金融 应 用 等 这 样 的 应 用 ， 数据 丢失 可 能 会 造成 灾难 性 的 后 果 
(在 后 一 种 情况 下 ， 无 论 对 银行 或 对 顾客 都 是 如 此 !) 。 因 此 ， 为 了 支持 这 些 应 用 ， 必 须 做 
一 些 工作 以 确保 由 应 用 程序 的 一 端 发 送 的 数据 正确 、 完 全 地 交付 给 该 应 用 程序 的 另 一 端 。 
如 果 一 个 协议 提供 了 这 样 的 确保 数据 交付 服务 ， 就 认为 提供 了 可 靠 数据 传输 (reliable data 
transfer) 。 运 输 层 协议 能 够 潜在 地 向 应 用 程序 提供 的 一 个 重要 服务 是 进程 到 进程 的 可 靠 数 
据 传输 。 当 一 个 运输 协议 提供 这 种 服务 时 ， 发 送 进程 只 要 将 其 数据 传递 进 套 接 字 ， 就 可 以 
完全 相信 该 数据 将 能 无 差错 地 到 达 接 收 进程 。 

当 一 个 运输 层 协议 不 提供 可 靠 数 据 传输 时 ， 由 发 送 进程 发 送 的 某 些 数据 可 能 到 达 不 了 
接收 进程 。 这 可 能 能 被 容忍 丢失 的 应 用 〈loss-tolerant application) 所 接受 ， 最 值得 注意 的 
是 多 媒体 应 用 ， 如 交谈 式 音频 /视频 ， 它 们 能 够 承受 一 定量 的 数据 丢失 。 在 这 些 多 媒体 应 
AYP, 丢失 的 数据 引起 播放 的 音频 /视频 出 现 小 干扰 ， 而 不 是 致命 的 损伤 。 

2. FHER 


在 第 1 章 中 我 们 引入 了 可 用 吞吐 量 的 概念 ， 在 沿 着 一 条 网 络 路 径 上 的 两 个 进程 之 间 的 
通信 会 话 场景 中 ， 可 用 吞吐 量 就 是 发 送 进程 能 够 向 接收 进程 交付 比特 的 速率 。 因 为 其 他 会 
话 将 共享 沿 着 该 网 络 路 径 的 带宽 ， 并 且 因 为 这 些 会 话 将 会 到 达 和 离开 ,该 可 用 吞吐 量 将 随 
时 间 波 动 。 这 些 观察 导致 另 一 种 自然 的 服务 ， 即 运输 层 协议 能 够 以 某 种 特定 的 速率 提供 确 





保 的 可 用 吞吐 量 。 使 用 这 种 服务 ,该 应 用 程序 能 够 请 求 + 比特 / 秒 的 确保 吞吐 量 ， 并 且 该 
运输 协议 能 够 确保 可 用 吞吐 量 总 是 为 至 少 r+ 比特 / 秒 。 这 样 的 确保 吞吐 量 的 服务 将 对 许多 
应 用 程序 有 吸引 力 。 例 如 ， 如 果 因 特 网 电话 应 用 程序 对 语音 以 32kbps 的 速率 进行 编码 ， 
那么 它 需 要 以 这 个 速率 向 网 络 发 送 数据 ， 并 以 该 速率 向 接收 应 用 程序 交付 数据 。 如 果 运 输 
协议 不 能 提供 这 种 吞吐 量 ， 该 应 用 程序 或 以 较 低 速率 进行 编码 (并 且 接 收 足够 的 吞吐 量 以 
维持 这 种 较 低 的 编码 速率 ) ， 或 它 可 能 必须 放弃 发 送 ， 这 是 因为 对 于 这 种 因特网 电话 应 用 
而 言 ， 接 收 所 需 吞 吐 量 的 一 半 是 几乎 没有 或 根本 没有 用 处 的 。 具 有 吞吐 量 要 求 的 应 用 程序 
被 称 为 带宽 敏感 的 应 用 (bandwidth-sensitive application) 。 许 多 当前 的 多 媒体 应 用 是 带宽 敏 
感 的 ， 尽 管 某 些 多 媒体 应 用 程序 可 能 采用 自 适应 编码 技术 对 数字 语音 或 视频 以 与 当前 可 用 
带宽 相 匹 配 的 速率 进行 编码 。 

带宽 敏感 的 应 用 具有 特定 的 吞吐 量 要 求 ， 而 弹性 应 用 (elastic application) 能 够 根据 
当时 可 用 的 带宽 或 多 或 少 地 利用 可 供 使 用 的 吞吐 量 。 电 子 邮件 、 文 件 传 输 以 及 Web 传送 
都 属于 弹性 应 用 。 当 然 ， 吞吐 量 是 越 多 越 好 。 有 一 句 格 言说 得 好 ， 钱 越 多 越 好 ， 人 越 瘦 越 
美 ， 我 们 永远 不 会 嫌 吞 吐 量 太 多 的 1 

3. 定时 

运输 层 协议 也 能 提供 定时 保证 。 如 同 具有 吞吐 量 保证 那样 ， 定 时 保证 能 够 以 多 种 形式 
实现 。 一 个 保证 的 例子 如 : 发 送 方 注入 进 套 接 字 中 的 每 个 比特 到 达 接 收 方 的 套 接 字 不 迟 于 
100ms。 这 种 服务 将 对 交互 式 实时 应 用 程序 有 吸引 力 ， 如 因特网 电话 、 虚 拟 环境 、 电 话 会 
议和 多 方 游戏 ， 所 有 这 些 服务 为 了 有 效 性 而 要 求 数据 交付 有 严格 的 时 间 限 制 (参见 第 9 章 
[ Gauthier 1999; Ramjee 1994] ) 。 例 如 ， 在 因特网 电话 中 ， 较 长 的 时 延 会 导致 会 话 中 出 现 
不 自然 的 停顿 ; 在 多 方 游戏 和 虚拟 互动 环境 中 ， 在 做 出 动作 并 看 到 来 自 环境 (如 来 自 位 于 
端 到 端 连接 中 另 一 端点 的 玩家 ) 的 响应 之 间 ， 较 长 的 时 延 使 得 它 失去 真实 感 。 对 于 非 实 时 
的 应 用 ， 较 低 的 时 延 总 比较 高 的 时 延 好 ， 但 对 端 到 端的 时 延 没 有 严格 的 约束 。 

4. 安全 性 

最 后 ,运输 协议 能 够 为 应 用 程序 提供 一 种 或 多 种 安全 性 服务 。 例 如 ， 在 发 送 主机 
中 ， 运 输 协议 能 够 加 密 由 发 送 进程 传输 的 所 有 数据 ， 在 接收 主机 中 ， 运 输 层 协议 能 够 在 
将 数据 交付 给 接收 进程 之 前 解密 这 些 数据 。 这 种 服务 将 在 发 送 和 接收 进程 之 间 提 供 机 密 
性 ， 以 防 该 数据 以 某 种 方式 在 这 两 个 进程 之 间 被 观察 到 。 运 输 协议 还 能 提供 除了 机 密 性 
以 外 的 其 他 安全 性 服务 ， 包 括 数据 完整 性 和 端点 鉴别 ， 我 们 将 在 第 8 章 中 详细 讨论 这 些 
主题 。 


2. 1.4 因特网 提供 的 运输 服务 


至 此 ， 我 们 已 经 考虑 了 计算 机 网 络 能 够 提供 的 通用 运输 服务 。 现 在 我 们 要 更 为 具体 地 
考察 由 因特网 提供 的 运输 服务 类 型 。 因 特 网 (更 一 般 的 是 TCP/IP 网 络 ) 为 应 用 程序 提供 
两 个 运输 层 协 议 ， 即 UDP 和 TCP。 当 你 (作为 一 个 软件 开发 者 ) 为 因特网 创建 一 个 新 的 
应 用 时 ， 首 先 要 做 出 的 决定 是 ， 选 择 UDP 还 是 选择 TCP。 每 个 协议 为 调用 它们 的 应 用 程序 
提供 了 不 同 的 服务 集合 。 图 2-4 显示 了 某 些 所 选 的 应 用 程序 的 服务 要 求 。 

1. TCP 服务 


TCP 服务 模型 包括 面向 连接 服务 和 可 靠 数据 传输 服务 。 当 某 个 应 用 程序 调用 TCP 作为 
其 运输 协议 时 ， 该 应 用 程序 就 能 获得 来 自 TCP 的 这 两 种 服务 。 
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应 用 数据 丢失 带宽 es eS 
文件 传输 不 能 丢失 弹性 Fi 
电子 邮件 不 能 丢失 弹性 过 | 
Web 文档 不 能 丢失 弹性 (JL kbps) 不 © | 
r 5 音频 (JL kbps ~ 1Mbps) 
因特网 电话 /视频 会 议 ABER E, 100ms 
视频 (10kbps ~5Mbps) 
流 式 存储 音频 /视频 AMER 同上 E, JØ 
交互 式 游戏 容忍 丢失 几 kbps ~ 10kbps 是 ，100ms 
智能 手机 讯息 不 能 丢失 弹性 是 和 不 是 





图 2-4 选择 的 网 络 应 用 的 要 求 


。 面向 连接 的 服务 : 在 应 用 层 数据 报 文 开始 流动 之 前 ，TCP 让 客户 和 服务 器 互相 交 
换 运 输 层 控制 信息 。 这 个 所 谓 的 握手 过 程 提 醒 客户 和 服务 器 ， 让 它们 为 大 量 分 组 
的 到 来 做 好 准备 。 在 握手 阶段 后 ,一 个 TCP 连接 (TCP connection) 就 在 两 个 进 
程 的 套 接 字 之 间 建 立 了 。 这 条 连接 是 全 双 工 的 ， 即 连接 双方 的 进程 可 以 在 此 连接 
上 同时 进行 报 文 收发 。 当 应 用 程序 结束 报 文 发 送 时 ， 必 须 拆除 该 连接 。 在 第 3 章 
中 我 们 将 详细 讨论 面向 连接 的 服务 ， 并 分 析 它 是 如 何 实现 的 。 

e 可 靠 的 数据 传送 服务 : 通信 进程 能 够 依靠 TCP， 无 差错 、 按 适当 顺序 交付 所 有 发 
送 的 数据 。 当 应 用 程序 的 一 端 将 字 节 流传 进 套 接 字 时 ， 它 能 够 依靠 TCP 将 相同 的 
字 节 流 交 付 给 接收 方 的 套 接 字 ， 而 没有 字 节 的 丢失 和 宛 余 。 

TCP 协议 还 具有 拥塞 控制 机 制 ， 这 种 服务 不 一 定 能 为 通信 进程 带 来 直接 好 处 ， 但 能 为 
因特网 带 来 整体 好 处 。 当 发 送 方 和 接收 方 之 间 的 网 络 出 现 拥塞 时 ，TCP 的 拥塞 控制 机 制 会 
抑制 发 送 进程 (客户 或 服务 器 ) 。 如 我 们 将 在 第 3 章 中 所 见 ， TCP 拥塞 控制 也 试图 限制 每 
A TOP 连接 ， 使 它们 达到 公平 共享 网 络 带 宽 的 目的 。 





TCP 安全 


| Kv TCP 还 是 UDP 都 没有 提供 任何 加 密 机 制 ， 这 就 是 说 发 送 进程 传 进 其 套 接 字 的 
| 数据 ， 与 经 网 络 传送 到 目的 进程 的 数据 相同 。 因 此 ， 举 例 来 说 如 果 某 发 送 进程 以 明文 方 
|A (PAn) 发 送 了 一 个 口令 进入 它 的 套 接 字 ， 该 明文 口令 将 经 过 发 送 方 与 接收 方 
之 间 的 所 有 链 路 传送 ， 这 就 可 能 在 任何 中 间 链 路 被 嗅 探 和 发 现 。 因 为 隐私 和 其 他 安全 问 
题 对 许多 应 用 而 言 已 经 成 为 至 关 重 要 的 问题 ， 所 以 因特网 界 已 经 研制 了 TCP 的 加 强 版 
本 ， 称 为 安全 套 接 字 层 (Secure Sockets Layer，SSL) A SSL 加 强 后 的 TCP 不 仅 能 够 做 
传统 的 TCP 所 能 做 的 一 切 ， 而 且 提供 了 关键 的 进程 到 进程 的 安全 性 服务 ， 包 括 加 密 、 数 
据 完 整 性 和 端点 鉴别 。 我 们 强调 SSL 不 是 与 TCP 和 UDP 在 相同 层次 上 的 第 三 种 因特网 
运输 协议 ， 而 是 一 种 对 TCP 的 加 强 ， 这 种 强化 是 在 应 用 层 上 实现 的 。 特 别 是 ， 如 果 一 个 
应 用 程序 要 使 用 SSL 的 服务 ， 它 需要 在 该 应 用 程序 的 客户 端 和 服务 器 端 包括 SSL 代码 
(利用 现 有 的 、 高 度 优 化 的 库 和 类 )。SSL 有 它 自己 的 套 接 字 API， 这 类 似 于 传统 的 TCP 
套 接 字 API。 当 一 个 应 用 使 用 SSL 时 ， 发 送 进 程 向 SSL 套 接 字 传递 明文 数据 ; 在 发 送 主 
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机 中 的 SSL 则 加 密 该 数据 并 将 加 密 的 数据 传递 给 TCP 套 接 字 。 加 密 的 数据 经 因特网 传送 
到 接收 进程 中 的 TCP 套 接 字 。 该 接收 套 接 字 将 加 密 数据 传递 给 SSL， 由 其 进行 解密 。 最 


后 ，SSL 通过 它 的 SSL 套 接 字 将 明文 数据 传递 给 接收 进程 。 我 们 将 在 第 8 章 中 更 为 详细 
地 讨论 SSL。 





2. UDP 服务 


UDP 是 一 种 不 提供 不 必要 服务 的 轻 量 级 运输 协议 ， 它 仅 提 供 最 小 服务 。UDP 是 无 连 
接 的 ， 因 此 在 两 个 进程 通信 前 没有 握手 过 程 。UDP 协议 提供 一 种 不 可 靠 数据 传送 服务 ， 也 
就 是 说 ， 当 进程 将 一 个 报 文 发 送 进 UDP 套 接 字 时 ，UDP 协议 并 不 保证 该 报 文 将 到 达 接 收 
进程 。 不 仅 如 此 ， 到 达 接 收 进程 的 报 文 也 可 能 是 乱 序 到 达 的 。 

UDP 没有 包括 拥塞 控制 机 制 ， 所 以 UDP 的 发 送 端 可 以 用 它 选 定 的 任何 速率 向 其 下 层 
(网 络 层 ) 注入 数据 。( 然 而， 值得 注意 的 是 实际 端 到 端 吞吐 量 可 能 小 于 该 速率 ， 这 可 能 
是 因为 中 间 链 路 的 带宽 受 限 或 因为 拥塞 而 造成 的 。) 

3. 因特网 运输 协议 所 不 提供 的 服务 

我 们 已 经 从 4 个 方面 组 织 了 运输 协议 服务 : 可 靠 数 据 传输 、 吞 吐 量 、 定 时 和 安全 性 。 
TCP 和 UDP 提供 了 这 些 服务 中 的 哪些 呢 ? 我 们 已 经 注意 到 TCP 提供 了 可 靠 的 端 到 端 数据 
传送 。 并 且 我 们 也 知道 TCP 在 应 用 层 可 以 很 容易 地 用 SSL 来 加 强 以 提供 安全 服务 。 但 在 我 
们 对 TCP 和 UDP 的 简要 描述 中 ， 明 显 地 漏 掉 了 对 吞吐 量 或 定时 保证 的 讨论 ， 即 这 些 服 务 
目前 的 因特网 运输 协议 并 没有 提供 。 这 是 否 意味 着 诸如 因特网 电话 这 样 的 时 间 敏 感应 用 不 
能 运行 在 今天 的 因特网 上 呢 ? 答案 显然 是 否定 的 ， 因 为 在 因特网 上 运行 时 间 敏 感应 用 已 经 
有 多 年 了 。 这 些 应 用 经 常 工作 得 相当 好 ， 因 为 它们 已 经 被 设计 成 尽 最 大 可 能 对 付 这 种 保证 
的 缺乏 。 我 们 将 在 第 9 章 中 研究 几 种 设计 技巧 。 无 论 如 何 ， 在 时 延 过 大 或 端 到 端 吞 吐 量 受 
限时 ， 好 的 设计 也 是 有 限制 的 。 总 之 ， 今 天 的 因特网 通常 能 够 为 时 间 敏 感应 用 提供 满意 的 
服务 ， 但 它 不 能 提供 任何 定时 或 带宽 保证 。 

图 2-5 指出 了 一 些 流行 的 因特网 应 用 所 使 用 的 运输 协议 。 可 以 看 到 ， 电 子 邮 件 、 远 程 
终端 访问 、Web、 文 件 传输 都 使 用 了 TCP。 这 些 应 用 选择 TCP 的 最 主要 原因 是 TCP 提供 了 
可 靠 数据 传输 服务 ， 确 保 所 有 数据 最 终 到 达 目 的 地 。 因 为 因特网 电话 应 用 (如 Skype) 通 
常 能 够 容忍 某 些 丢 失 但 要 求 达到 一 定 的 最 小 速率 才能 有 效 工作 ， 所 以 因特网 电话 应 用 的 开 
发 者 通常 愿意 将 该 应 用 运行 在 UDP 上 ， 从 而 设法 避 开 TCP 的 拥塞 控制 机 制 和 分 组 开销 。 
但 因为 许多 防火 墙 被 配置 成 阻挡 (大 多 数 类 型 的 ) UDP 流量 ， 所 以 因特网 电话 应 用 通常 
设计 成 如 果 UDP 通信 失败 就 使 用 TCP 作为 备份 。 











应 用 层 协议 支撑 的 运输 协议 
Si [RAC 
Telnet [RFC 854] TCP 
HTTP [ RFC 2616] TCP 
FIP [RFC 959] TCP 
HTTP (如 YouTube) TCP 

因特网 电话 SIP [RFC 3261], RTP [RFC 3550] 或 专用 的 〈 如 Skype) UDP 或 TCP 





图 2-5 流行 的 因特网 应 用 及 其 应 用 层 协 议和 支撑 的 运输 协议 
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2.1.5 应 用 层 协议 


我 们 刚刚 学 习 了 通过 把 报 文 发 送 进 套 接 字 实 现 网 络 进程 间 的 相互 通信 。 但 是 如 何 构造 
这 些 报 文 ? 在 这 些 报 文中 的 各 个 字段 的 含义 是 什么 ? 进程 何 时 发 送 这 些 报 文 ? 这 些 问题 将 
我 们 带 进 应 用 层 协议 的 范围 。 应 用 层 协 议 (application-layer protocol) 定义 了 运行 在 不 同 
端 系统 上 的 应 用 程序 进程 如 何 相互 传递 报 文 。 特 别 是 应 用 层 协议 定义 了 : 

© 交换 的 报 文 类 型 ， 例 如 请 求 报 文 和 响应 报 文 。 

© 各 种 报 文 类 型 的 语法 ， 如 报 文中 的 各 个 字段 及 这 些 字段 是 如 何 描述 的 。 

。 字段 的 语义 ， 即 这 些 字段 中 的 信息 的 含义 。 

© 确定 一 个 进程 何 时 以 及 如 何 发 送 报 文 ， 对 报 文 进行 响应 的 规则 。 

有 些 应 用 层 协议 是 由 RFC 文档 定义 的 ， 因 此 它们 位 于 公共 域 中 。 例 如 ，Web 的 应 用 
层 协 议 HTTP ( 超 文 本 传输 协议 [RFC 2616]) 就 作为 一 个 RFC 可 供 使 用 。 如 果 浏 览 器 开 
发 者 遵从 HTTP REC 规则 ， 所 开发 出 的 浏览 器 就 能 访问 任何 遵从 该 文档 标准 的 Web 服务 器 
并 获取 相应 Web 页 面 。 还 有 很 多 别 的 应 用 层 协议 是 专用 的 ， 有 意 不 为 公共 域 使 用 。 例 如 ， 
Skype 使 用 了 专用 的 应 用 层 协议 。 

区 分 网 络 应 用 和 应 用 层 协议 是 很 重要 的 。 应 用 层 协 议 只 是 网 络 应 用 的 一 部 分 〈 尽 管 从 
我 们 的 角度 看 ， 它 是 应 用 非常 重要 的 一 部 分 ) 。 我 们 来 看 一 些 例子 。Web 是 一 种 客户 - 服 
务 器 应 用 ， 它 允许 客户 按照 需求 从 Web 服务 器 获得 文档 。 该 Web 应 用 有 很 多 组 成 部 分 ， 
包括 文档 格式 的 标准 (EI HTML), Web 浏览 器 (如 Firefox 和 Microsoft Internet Explorer) 、 
Web 服务 器 (如 Apache, Microsoft 服务 器 程序 ) ， 以 及 一 个 应 用 层 协 议 。Web 的 应 用 层 协 
We HTTP, CENT FEM REA Web 服务 器 之 间 传 输 的 报 文 格式 和 序列 。 因 此 ，HTTP 

只 是 Web 应 用 的 一 个 部 分 (尽管 是 重要 部 分 ) 。 举 另外 一 个 例子 ， 因 特 网 电子 邮件 应 用 也 
有 很 多 组 成 部 分 ， 包括 能 容纳 用 户 邮箱 的 邮件 服务 器 、 人 允许 用 户 读 取 和 生成 邮件 的 邮件 客 
户 程序 (如 Microsoft Outlook)、 定 义 电子 邮件 报 文 结构 的 标准 、 定 义 报 文 如 何在 服务 器 之 
间 以 及 如 何在 服务 器 与 邮件 客户 程序 之 间 传 递 的 应 用 层 协议 、 定 义 如 何 对 报 文 首部 的 内 容 
进行 解释 的 应 用 层 协议 。 用 于 电子 邮件 的 主要 应 用 层 协议 就 是 SMTP (简单 邮件 传输 协议 
[RFC5321] )。 因 此 ， 电 子 邮 件 的 首要 应 用 层 协 议 SMTP 也 只 是 电子 邮件 应 用 的 一 个 部 分 
(尽管 是 重要 部 分 ) 。 


21.6 本 书 涉及 的 网 络 应 用 


每 天 都 有 新 的 公共 域 或 者 专用 域 因 特 网 应 用 被 开发 出 来 。 我 们 不 愿 像 百 科 全 书 一 样 
涉及 大 量 的 因特网 应 用 ， 而 是 选择 其 中 几 种 重要 而 流行 的 应 用 加 以 关注 。 在 本 章 中 我 们 
详细 讨论 5 种 重要 的 应 用 : Web、 文 件 传输 、 电 子 邮 件 、 目 录 服 务 、 流 式 视频 和 P2P。 
我 们 首先 讨论 Web 应 用 ， 不 仅 因为 它 是 极为 流行 的 应 用 ， 而 且 因为 它 的 应 用 层 协议 
HTTP 比 较 简单 并 且 易 于 理解 。 我 们 接 下 来 讨论 电子 邮件 ， 这 是 因特网 上 第 一 个 招 人 喜 
爱 的 应 用 程序 。 说 电子 邮件 比 Web 更 复杂 ， 是 因为 它 使 用 了 多 个 而 不 是 一 个 应 用 层 协 
议 。 在 电子 邮件 之 后 ,我们 学 习 DNS， 它 为 因特网 提供 目录 服务 。 大 多 数 用 户 不 直接 与 
DNS 打交道 ， 而 是 通过 其 他 的 应 用 (包括 Web、 文 件 传输 和 电子 邮件 ) 间接 使 用 它 。 
DNS 很 好 地 说 明了 一 种 核心 的 网 络 功能 (网络 名 字 到 网 络 地 址 的 转换 ) 是 怎样 在 因 特 
网 的 应 用 层 实 现 的 。 然 后 我 们 讨论 PP 文件 共享 应 用 ， 通 过 讨论 包括 经 内 容 分 发 网 分 发 
存储 的 视频 在 内 的 按 需 流 式 视频 ， 结 束 应 用 层 的 学 习 。 在 第 9 章 中 ， 我 们 将 涉及 多 媒体 





应 用 ,包括 VoIP 视频 会 议 。 
2.2 Web 和 HTTP 


20 世纪 90 年 代 以 前 ， 因 特 网 的 主要 使 用 者 还 是 研究 人 员 、 学 者 和 大 学 生 ， 他 们 登 
录 远 程 主机 ， 在 本 地 主机 和 远程 主机 之 间 传 输 文 件 ， 收 发 新 闻 ， 收 发 电子 邮件 。 尽 管 这 
些 应 用 非常 有 用 〈 并 且 继 续 如 此 ) ， 但 是 因特网 基本 上 不 为 学 术 界 和 研究 界 之 外 所 知 。 
到 了 20 世纪 90 年 代 初 期 ， 一 个 主要 的 新 型 应 用 即 万 维 网 (World Wide Web) ETHES 
[Berners-Lee 1994] 。Web 是 一 个 引起 公众 注意 的 因特网 应 用 ， 它 极 大 地 改变 了 人 们 与 工 
作 环 境内 外 交流 的 方式 。 它 将 因特网 从 只 是 很 多 数据 网 之 一 的 地 位 提升 为 仅 有 的 一 个 数 
据 网 。 

也 许 对 大 多 数 用 户 来 说 ， 最 具有 吸引 力 的 就 是 Web 的 按 需 操作 。 当 用 户 需要 时 ， 就 
能 得 到 所 想 要 的 内 容 。 这 不 同 于 无 线 电 广播 和 电视 ， 它 们 迫使 用 户 只 能 收听 、 收 看 内 容 提 
供 者 提供 的 节目 。 除 了 可 以 按 需 操作 以 外 ，Web 还 有 很 多 让 人 们 喜欢 和 珍爱 的 特性 。 任 何 
人 使 信息 在 Web 上 可 用 都 非常 简单 ， 即 只 需要 极 低 的 费用 就 能 成 为 出 版 人 。 超 链接 和 搜 
索引 擎 帮助 我 们 在 Web 站 点 的 海洋 里 导航 。 图 片 和 视频 刺激 着 我 们 的 感官 。 表 单 、 
JavaSeript、Java. 小 程序 和 很 多 其 他 的 装置 ， 使 我 们 可 以 与 Web 页 面 和 站 点 进行 交互 。 并 
A, Web 及 其 协议 作为 平台 ， 为 YouTube 、 基 于 Web 的 电子 邮件 (如 Gmail) 和 大 多 数 移 
动因 特 网 应 用 (包括 Instagram 和 谷歌 地 图 ) 服务 。 


2.2.1 HTTP 概况 


Web 的 应 用 层 协议 是 超 文本 传输 协议 (HyperText Transfer Protocol, HTTP), Ea: Web 
的 核心 , 在 [RFC 1945] 和 [RFC 2616] 中 进行 了 定义 。HTTP 由 两 个 程序 实现 : 一 个 客 
户 程序 和 一 个 服务 器 程序 。 客 户 程序 和 服务 器 程序 运行 在 不 同 的 端 系统 中 ， 通 过 交换 
HTTP 报 文 进行 会 话 。HTTP 定义 了 这 些 报 文 的 结构 以 及 客户 和 服务 器 进行 报 文 交 换 的 方 
式 。 在 详细 解释 HTTP 之 前 ， 应 当 回 顾 某 些 Web 术语 。 

Web 页 面 (Web page) (也 叫 文档 ) 是 由 对 象 组 成 的 。 一 个 对 象 (object) 只 是 一 个 文 
件 ， 诸 如 一 个 HTML 文件 、 一 个 JPEG 图 形 、 一 个 Java 小 程序 或 一 个 视频 片段 这 样 的 文件 ， 
且 它 们 可 通过 一 个 URL 地 址 寻 址 。 多 数 Web 页 面 含有 一 个 HTML 基本 文件 (base HTML 
fille) 以 及 几 个 引用 对 象 。 例 如 ， 如 果 一 个 Web 页 面包 含 HTML 文本 和 5 个 JPEG KIE, 
么 这 个 Web 页 面 有 6 个 对 象 : 一 个 HTML 基本 文件 加 5 个 图 形 。HTML 基本 文件 通过 对 象 
的 URL 地 址 引用 页 面 中 的 其 他 对 象 。 每 个 URL 地 址 由 两 部 分 组 成 : 存放 对 象 的 服务 器 主 
机 名 和 对 象 的 路 径 名 。 例 如 ，URL 地 址 http://www. someSchool. edu/someDepartment/pic- 
ture, gif， 其 中 的 www. someSchool. edu 就 是 主机 名 ，/someDepartment/picture. gif 就 是 路 径 
Zo WX Web 浏览 器 (Web browser) (例如 Internet Explorer 和 Firefox) 实现 了 HTTP 的 客 
户 端 ， 所 以 在 Web 环境 中 我 们 经 常 交 替 使 用 “浏览 器 ”和 “客户 ”这 两 个 术语 。Web AR 
务 器 (Web server) 实现 了 HTTP 的 服务 器 端 ， 它 用 于 存储 Web 对 象 ， 每 个 对 象 由 URL 寻 
址 。 流 行 的 Web 服务 器 有 Apache 和 Microsoft Internet Information Server (微软 互联 网 信息 
IRIA) 。 

HTTP 定义 了 Web 客户 向 Web 服务 器 请 求 Web 页 面 的 方式 ， 以 及 服务 器 向 客户 传 
送 Web 页 面 的 方式 。 我 们 稍 后 详细 讨论 客户 和 服务 器 的 交互 过 程 ， 而 其 基本 思想 在 
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图 2-6 中 进行 了 图 示 。 当 用 户 请 求 一 个 Web 页 面 (如 点 击 一 个 超 链接 ) 时 ;浏览 器 向 
服务 器 发 出 对 该 页 面 中 所 包含 对 象 的 运行 Apache Web 

HTTP 请 求 报 文 ， 服 务 器 接收 到 请 求 并 用 服务 器 的 服务 器 

包含 这 些 对 象 的 HTTP 响 应 报 文 进行 Ša 

响应 。 





HTTP 使 用 TCP 作为 它 的 支撑 运输 协 f x 
W (而 不 是 在 UDP 上 运行 )。HTTP 客户 Ses mr Ne 
首先 发 起 一 个 与 服务 器 的 TCP 连接 。 一 旦 SSS NS 
连接 建立 ， 该 浏览 器 和 服务 器 进程 就 可 以 
通过 套 接 字 接口 访问 TCP。 如 同 在 2.1 节 日 
中 描述 的 那样 ， 客 户 端的 套 接 字 接口 是 客 
户 进程 与 TCP 连接 之 间 的 门 ， 在 服务 器 端 er 
的 套 接 字 接 口 则 是 服务 器 进程 与 TCP 连接 
之 间 的 门 。 客 户 向 它 的 套 接 字 接 口 发 送 图 2-6 HTTP 的 请 求 -响应 行为 
HTTP 请 求 报 文 并 从 它 的 套 接 字 接口 接收 HTTP 响应 报 文 。 类 似 地 ， 服 务 器 从 它 的 套 接 字 
接口 接收 HTTP 请 求 报 文 和 向 它 的 套 接 字 接 口 发 送 HTTP 响应 报 文 。 一 旦 客户 向 它 的 套 接 
字 接 口 发 送 了 一 个 请 求 报 文 ， 该 报 文 就 脱离 了 客户 控制 并 进入 TCP 的 控制 。2. 1 节 讲 过 ， 
TCP 为 HTTP 提供 可 靠 数 据 传输 服务 。 这 意味 着 ， 一 个 客户 进程 发 出 的 每 个 HTTP 请 求 报 
文 最 终 能 完整 地 到 达 服 务 器 ;类 似 地 ， 服 务 器 进程 发 出 的 每 个 HTTP 响应 报 文 最 终 能 完整 
地 到 达 客 户 。 这 里 我 们 看 到 了 分 层 体 系 结构 最 大 的 优点 ， 即 HTTP 协议 不 用 担心 数据 丢 
失 ， 也 不 关注 TCP 从 网 络 的 数据 丢失 和 乱 序 故障 中 恢复 的 细节 。 那 是 TCP 以 及 协议 栈 较 
低层 协议 的 工作 。 

注意 到 下 列 现象 很 重要 : 服务 器 向 客户 发 送 被 请 求 的 文件 ， 而 不 存储 任何 关于 该 客户 
的 状态 信息 。 假 如 某 个 特定 的 客户 在 短 短 的 几 秒 内 两 次 请 求 同 一 个 对 象 ， 服 务 器 并 不 会 因 
为 刚刚 为 该 客户 提供 了 该 对 象 就 不 再 做 出 反应 ， 而 是 重新 发 送 该 对 象 ， 就 像 服务 器 已 经 完 
> 忘记 不 久之 前 所 做 过 的 事 一 样 。 因 为 HTTP 服务 器 并 不 保存 关于 客户 的 任何 信息 ， 所 以 
我 们 说 HTTP 是 一 个 无 状态 协议 (stateless protocol) 。 我 们 同时 也 注意 到 Web 使 用 了 客户 
-服务 器 应 用 程序 体系 结构 (如 2. 1 节 所 述 ) 。Web 服务 器 总 是 打开 的 ， 具 有 一 个 固定 的 
IP 地 址 ， 且 它 服务 于 可 能 来 自 数 以 百 万 计 的 不 同 浏览 器 的 请 求 。 


2. 2.2， 非 持续 连接 和 持续 连接 


在 许多 因特网 应 用 程序 中 ， 客 户 和 服务 器 在 一 个 相当 长 的 时 间 范 围 内 通信 ， 其 中 客户 
发 出 一 系列 请 求 并 且 服 务 器 对 每 个 请 求 进行 响应 。 依 据 应 用 程序 以 及 该 应 用 程序 的 使 用 方 
式 ， 这 一 系列 请 求 可 以 以 规则 的 间隔 周期 性 地 或 者 间断 性 地 一 个 接 一 个 发 出 。 当 这 种 客 
户 -服务 器 的 交互 是 经 TCP 进行 的 ， 应 用 程序 的 研制 者 就 需要 做 一 个 重要 决定 ， 即 每 个 请 
求 /响应 对 是 经 一 个 单独 的 TCP 连接 发 送 ， 还 是 所 有 的 请 求 及 其 响应 经 相同 的 TCP 连接 发 
送 呢 ? 采用 前 一 种 方法 ， 该 应 用 程序 被 称 为 使 用 非 持 续 连接 (non- persistent connection ) ; 
采用 后 一 种 方法 ， 该 应 用 程序 被 称 为 使 用 持续 连接 (persistent connection) 。 为 了 深入 地 理 
解 该 设计 问题 ， 我 们 研究 在 特定 的 应 用 程序 即 HTTP 的 情况 下 持续 连接 的 优点 和 缺点 ， 
HTTP 既 能 够 使 用 非 持 续 连 接 ， 也 能 够 使 用 持续 连接 。 尽 管 HTTP 在 其 默认 方式 下 使 用 持 
续 连 接 ，HTTP 客户 和 服务 器 也 能 配置 成 使 用 非 持 续 连 接 。 
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1. 采用 非 持续 连接 的 HTTP 

我 们 看 看 在 非 持 续 连 接 情 况 下 ， 从 服务 器 向 客户 传送 一 个 Web 页 面 的 步 又。 假设 该 页 
面 含有 一 个 HTML 基本 文件 和 10 个 JPEG 图 形 ， 并 且 这 11 个 对 象 位 于 同一 台 服 务 器 上 。 进 
一 步 假设 该 HTML 文件 的 URL 为 : http://www. someSchool. edu/someDepartment/home. index, 

我 们 看 看 发 生 了 什么 情况 : 

1) HTTP 客户 进程 在 端口 号 80 发 起 一 个 到 服务 器 www. someSchool. edu 的 TCP 连接 ， 
该 端口 号 是 HTTP 的 默认 端口 。 在 客户 和 服务 器 上 分 别 有 一 个 套 接 字 与 该 连接 相关 联 。 

2) HTTP 客户 经 它 的 套 接 字 向 该 服务 器 发 送 一 个 HTTP 请 求 报 文 。 请 求 报 文中 包含 了 
路 径 名 /someDepartment/home. index (后 面 我 们 会 详细 讨论 HTTP 报 文 )。 

3) HTTP 服务 器 进程 经 它 的 套 接 字 接收 该 请 求 报 文 ， 从 其 存储 器 CRAM 或 磁盘 ) 中 
检索 出 对 象 www. someSchool. edu/ someDepartment/home. index， 在 一 个 HTTP 响应 报 文中 封 
装 对 象 ， 并 通过 其 套 接 字 向 客户 发 送 响 应 报 文 。 

4) HTTP 服务 器 进程 通知 TCP 断 开 该 TCP 连接 。 (但 是 直到 TCP 确认 客户 已 经 完整 
地 收 到 响应 报 文 为 止 ， 它 才 会 实际 中 断 连接 。) 

5) HTTP 客户 接收 响应 报 文 ，TCP 连接 关闭 。 该 报 文 指出 封装 的 对 象 是 一 个 HTML 文 
件 ， 客 户 从 响应 报 文中 提取 出 该 文件 ， 检 查 该 HTML 文件 ， 得 到 对 10 个 JPEG 图 形 的 引用 。 

6) 对 每 个 引用 的 JPEG 图 形 对 象 重 复 前 4 个 步骤 。 

当 浏 览 器 收 到 Web 页 面 后 ， 向 用 户 显 示 该 页 面 。 两 个 不 同 的 浏览 器 也 许 会 以 不 同 的 
方式 解释 ( 即 向 用 户 显 示 ) 该 页 面 。HTTP 与 客户 如 何 解 释 一 个 Web 页 面 毫 无 关系 。 
HTTP 规范 ( [RFC 1945] 和 [RFC 2616]) 仅 定 义 了 在 HTTP 客户 程序 与 HTTP 服务 器 程 
序 之 间 的 通信 协议 。 

上 面 的 步骤 举例 说 明了 非 持续 连接 的 使 用 ， 其 中 每 个 TCP 连接 在 服务 器 发 送 一 个 对 象 后 
关闭 ， 即 该 连接 并 不 为 其 他 的 对 象 而 持续 下 来 。 值 得 注意 的 是 每 个 TCP 连接 只 传输 一 个 请 求 
报 文 和 一 个 响应 报 文 。 因 此 在 本 例 中 ， 当 用 户 请 求 该 Web 页 面 时 ， 要 产生 11 个 TCP 连接 。 

在 上 面 描述 的 步骤 中 ， 我 们 有 意 没 有 明确 客户 获得 这 10 个 JPEG 图 形 对 象 是 使 用 10 个 串 
行 的 TCP 连接 ， 还 是 某 些 JPEG 对 象 使 用 了 一 些 并 行 的 TCP 连接 。 事 实 上 ， 用 户 能 够 配置 现代 
浏览 器 来 控制 连接 的 并 行 度 。 在 默认 方式 下 ， 大 部 分 浏览 器 打开 5 ~ 10 个 并 行 的 TCP 连接 ， 而 
每 条 连接 处 理 一 个 请 求 响应 事务 。 如 果 用 户 愿 意 ， 最 大 并 行 连接 数 可 以 设置 为 1， 这样 10 RE 
接 就 会 串 行 建立 。 我 们 在 下 一 章 会 看 到 ,使 a 
用 并 行 连接 可 以 缩短 响应 时 间 。 

在 继续 讨论 之 前 ， 我 们 来 简单 估算 一 下 
从 客户 请 求 HTML 基本 文件 起 到 该 客户 收 到 
整个 文件 止 所 花费 的 时 间 。 为 此 ， 我 们 给 出 
往返 时 间 (Round-Trip Time, RTT) 的 定义 ， 
该 时 间 是 指 一 个 短 分 组 从 客户 到 服务 器 然后 
再 返回 客户 所 花费 的 时 间 。RTT 包括 分 组 传 
播 时 延 、 分 组 在 中 间 路 由 器 和 交换 机 上 的 排 
队 时 延 以 及 分 组 处 理 时 延 (这 些 时 延 在 9 : 

1.4 节 已 经 讨论 过 ) 。 现 在 考虑 当 用 户 点 击 客户 的 时 间 服务 器 的 时 间 
超 链接 时 会 发 生 什么 现象 。 如 图 2-7 所 示 ， 图 2-7 请 求 并 接收 一 个 HTML 文件 所 需 的 时 间 估 算 
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这 引起 浏览 器 在 它 和 Web 服务 器 之 间 发 起 一 个 TCP 连接 ; 这 涉及 一 次 “三 次 握手 ”过 程 ， 
即 客 户 向 服务 器 发 送 一 个 小 TCP 报 文 段 ， 服 务 器 用 一 个 小 TCP 报 文 段 做 出 确认 和 响应 ， 
最 后 ， 客 户 向 服务 器 返回 确认 。 三 次 握手 中 前 两 个 部 分 所 耗费 的 时 间 占 用 了 一 个 RTT。 完 
成 了 三 次 握手 的 前 两 个 部 分 后 ， 客 户 结合 三 次 握手 的 第 三 部 分 (确认 ) 向 该 TCP 连接 发 
送 一 个 HTTP 请 求 报 文 。 一 旦 该 请 求 报 文 到 达 服 务 器 ,服务器 就 在 该 TCP 连接 上 发 送 
HTML 文 件 。 该 HTTP 请 求 /响应 用 去 了 另 一 个 RTT。 因 此 ,粗略 地 讲 ， 总 的 响应 时 间 就 是 
两 个 RTT 加 上 服务 器 传输 HTML 文件 的 时 间 。 

2. 采用 持续 连接 的 HTTP 

非 持续 连接 有 一 些 缺 点 。 第 一 ， 必 须 为 每 一 个 请 求 的 对 象 建立 和 维护 一 个 全 新 的 连 
接 。 对 于 每 个 这 样 的 连接 ， 在 客户 和 服务 器 中 都 要 分 配 TCP 的 缓冲 区 和 保持 TCP 变量 ， 
这 给 Web 服务 器 带 来 了 严重 的 负担 ， 因 为 一 台 Web 服务 器 可 能 同时 服务 于 数 以 百 计 不 同 
的 客户 的 请 求 。 第 二 ， 就 像 我 们 刚 描 述 的 那样 ， 每 一 个 对 象 经 受 两 倍 RTT 的 交付 时 延 ， 
即 一 个 RTT 用 于 创建 TCP， 另 一 个 RTT 用 于 请 求 和 接收 一 个 对 象 。 

在 采用 HTTP 1. 1 持续 连接 的 情况 下 ， 服 务 器 在 发 送 响 应 后 保持 该 TCP ERITH. 在 
相同 的 客户 与 服务 器 之 间 ， 后 续 的 请 求 和 响应 报 文 能 够 通过 相同 的 连接 进行 传送 。 特 别 
是 ,一 个 完整 的 Web 页 面 (上 例 中 的 HTML 基本 文件 加 上 10 个 图 形 ) 可 以 用 单个 持续 
TCP 连接 进行 传送 。 更 有 其 者 ， 位 于 同一 人 台 服 务 器 的 多 个 Web 页 面 在 从 该 服务 器 发 送 给 同 
一 个 客户 时 ， 可 以 在 单个 持续 TCP 连接 上 进行 。 对 对 象 的 这 些 请 求 可 以 一 个 接 一 个 地 发 
出 ， 而 不 必 等 待 对 未 决 请 求 〈 流 水 线 ) 的 回答 。 一 般 来 说 ， 如 果 一 条 连接 经 过 一 定时 间 间 
隔 (一 个 可 配置 的 超时 间隔 ) 仍 未 被 使 用 ，HTTP 服务 器 就 关闭 该 连接 。HTTP 的 默认 模 
式 是 使 用 带 流 水 线 的 持续 连接 。 最 近 ，HTTP/2 [RFC 7540] 是 在 HTTP 1.1 基础 上 构建 
的 ， 它 允许 在 相同 连接 中 多 个 请 求 和 回答 交错 ， 并 增加 了 在 该 连接 中 优化 HTTP 报 文 请 求 
和 回答 的 机 制 。 我 们 把 量化 比较 持续 连接 和 非 持续 连接 性 能 的 任务 留 作 第 2、3 章 的 课 后 
习题 。 鼓 励 读 者 阅读 文献 【Heidemann 1997; Nielsen 1997; RFC 7540], 


2.2.3 HTTP 报 文 格式 


HTTP 规范 [RFC 1945; RFC 2616; RFC 7540] 包含 了 对 HTTP 报 文 格式 的 定义 。HTTP 
报 文 有 两 种 : 请 求 报 文 和 响应 报 文 。 下 面 讨论 这 两 种 报 文 。 

1. HTTP 请 求 报 文 

下 面 提供 了 一 个 典型 的 HTTP 请 求 报 文 : 


GET /somedir/page.html HTTP/1.1 
Host: www.someschool.edu 
Connection: close 

User-agent: Mozilla/5.0 
Accept-language: fr 


通过 仔细 观察 这 个 简单 的 请 求 报 文 ， 我 们 就 能 学 到 很 多 东西 。 首 先 ， 我 们 看 到 该 报 文 
是 用 普通 的 ASCI 文本 书写 的 ， 这 样 有 一 定 计算 机 知识 的 人 都 能 够 阅读 它 。 其 次 ， 我 们 看 
到 该 报 文 由 5 行 组 成 ， 每 行 由 一 个 回 车 和 换行 符 结束 。 最 后 一 行 后 再 附加 一 个 回 车 换行 
符 。 虽 然 这 个 特定 的 报 文 仅 有 5 行 ， 但 一 个 请 求 报 文 能 够 具有 更 多 的 行 或 者 至 少 为 一 行 。 
HTTP 请 求 报 文 的 第 一 行 叫 作 请 求 行 (request line) ， 其 后 继 的 行 叫 作 首部 行 (header 
line) 。 请 求 行 有 3 个 字段 : 方法 字段 、URL 字段 和 HTTP 版 本 字段 。 方 法 字段 可 以 取 几 种 
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不 同 的 值 ， 包括 GET, POST, HEAD, PUT 和 DELETE。 绝 大 部 分 的 HTTP 请 求 报 文 使 用 
GET 方法 。 当 浏览 器 请 求 一 个 对 象 时 ， 使 用 GET 方法 , 在 URL 字段 带 有 请 求 对 象 的 标识 。 
在 本 例 中 ， 该 浏览 器 正在 请 求 对象 /somedir/page. html。 其 版 本 字段 是 自 解释 的 ; 在 本 例 
中 ,浏览 器 实现 的 是 HTTP/1. 1 版 本 。 

现在 我 们 看 看 本 例 的 首部 行 。 首 部 行 Host; www. someschool. edu 指明 了 对 象 所 在 的 主 
机 。 你 也 许 认为 该 首部 行 是 不 必要 的 ， 因 为 在 该 主机 中 已 经 有 一 条 TCP 连接 存在 了 。 但 
是 ， 如 我 们 将 在 2.2.5 节 中 所 见 ， 该 首部 行 提供 的 信息 是 Web 代理 高 速 缓存 所 要 求 的 。 通 
过 包含 Connection: close 首部 行 ， 该 浏览 器 告诉 服务 器 不 要 麻烦 地 使 用 持续 连接 ， 它 要 求 
服务 器 在 发 送 完 被 请 求 的 对 象 后 就 关闭 这 条 连接 。User-agent: 首部 行 用 来 指明 用 户 代理 ， 
即 向 服务 器 发 送 请 求 的 浏览 器 的 类 型 。 这 里 浏览 器 类 型 是 Mozilla/5.0， 即 Firefox 浏览 器 。 
这 个 首部 行 是 有 用 的 ， 因 为 服务 器 可 以 有 效 地 为 不 同类 型 的 用 户 代理 实际 发 送 相同 对 象 的 
不 同 版 本 。( 每 个 版 本 都 由 相同 的 URL 寻 址 。) 最 后 ，Accept-language: 首部 行 表示 用 户 想 
得 到 该 对 象 的 法 语 版 本 〈 如 果 服 务 器 中 有 这 样 的 对 象 的 话 ) ; 和 否则， 服务 器 应 当 发 送 它 的 
默认 版 本 。Accept-language: 首部 行 仅 是 HTTP 中 可 用 的 众多 内 容 协商 首部 之 一 。 

看 过 一 个 例子 之 后 ， 我 们 再 来 看 看 如 图 2-8 所 示 的 一 个 请 求 报 文 的 通用 格式 。 我 们 看 
到 该 通用 格式 与 我 们 前 面 的 例子 密切 对 
应 。 然 而 ， 你 可 能 已 经 注意 到 了 在 首部 — 
行 ( 和 附加 的 回 车 和 换行 ) 后 有 一 个 A 
“实体 体 ” (entity body) 。 使 用 GET 方 
法 时 实体 体 为 空 ， 而 使 用 POST 方法 时 
才 使 用 该 实体 体 。 当 用 户 提交 表单 时 ， + 
HTTP 客户 常常 使 用 POST 方法 ， 例 如 ati 
当 用 户 向 搜索 引擎 提供 搜索 关键 词 时 。 
使 用 POST 报 文 时 ， 用 户 仍 可 以 向 服务 “实体 体 上 
器 请 求 一 个 Web 页 面 , 但 Web 页 面 的 i 
特定 内 容 依赖 于 用 户 在 表单 字段 中 输入 m À 
的 内 容 。 如 果 方法 字段 的 值 为 POST 时 ， Seta 
则 实体 体 中 包含 的 就 是 用 户 在 表单 字段 中 的 输入 值 。 

当然 ， 如 果 不 提 “用 表单 生成 的 请 求 报 文 不 是 必须 使 用 POST 方法 ”这 一 点 ， 那 将 是 
失职 。 相 反 ，HTML 表单 经 常 使 用 GET 方法 ,并 在 (表单 字段 中 ) 所 请 求 的 URL 中 包括 
输入 的 数据 。 例 如 ， 时 它 有 两 个 字段 ， 分 别 填写 的 是 “monkeys” 
和 “bananas”， 这 样 ， 该 URL 结构 为 www. somesite. com/animalsearch? monkeys&bananas。 
EHA HMEN, 你 也 许 已 经 留意 到 了 这 种 扩展 的 URL, 

HEAD 方法 类 似 于 GET 方法 。 当 服务 器 收 到 一 个 使 用 HEAD 方法 的 请 求 时 ， 将 会 用 一 
个 HTTP 报 文 进行 响应 ， 但 是 并 不 返回 请 求 对 象 。 应 用 程序 开发 者 常用 HEAD 方法 进行 调 
试 跟踪 。PUT 方法 常 与 Web 发 行 工具 联合 使 用 ， 它 允许 用 户 上 传 对 象 到 指定 的 Web 服务 
器 上 指定 的 路 径 〈 目 录 ) PUT 方法 也 被 那些 需要 向 Web 服务 器 上 传 对 象 的 应 用 程序 使 
用 。DELETE 方法 允许 用 户 或 者 应 用 程序 删除 Web 服务 器 上 的 对 象 。 


2. HTTP 响应 报 文 
下 面 我 们 提供 了 一 条 典型 的 HTTP 响应 报 文 。 该 响应 报 文 可 以 是 对 刚刚 讨论 的 例子 中 
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请 求 报 文 的 响应 。 


HTTP/1.1 200 OK 

Connection: close 

Date: Tue, 18 Aug 2015 15:44:04 GMT 

Server: Apache/2.2.3 (CentOS) 

Last-Modified: Tue, 18 Aug 2015 15:11:03 GMT 
Content-Length: 6821 

Content-Type: text/html 


(data data data data data ...) 


我 们 仔细 看 一 下 这 个 响应 报 文 。 它 有 三 个 部 分 : 一 个 初始 状态 行 (status line), 6 个 
HABIT (header line) ， 然 后 是 实体 体 (entity body) 。 实 体 体 部 分 是 报 文 的 主要 部 分 ， 即 它 
包含 了 所 请 求 的 对 象 本 身 (表示 为 data data data data data …)。 状 态 行 有 3 个 字段 : 协议 
版 本 字段 、 状 态 码 和 相应 状态 信息 。 在 这 个 例子 中 ， 状 态 行 指示 服务 器 正在 使 用 HT TP/ 

1， 并 且 一 切 正常 ( 即 服 务 器 已 经 找到 并 正在 发 送 所 请 求 的 对 象 ) 。 

我 们 现在 来 看 看 首部 行 。 服 务 器 用 Connection: close 首部 行 告诉 客户 ， 发 送 完 报 文 后 
将 关闭 该 TCP 连接 。Date: 首部 行 指示 服务 器 产生 并 发 送 该 响应 报 文 的 日 期 和 时 间 。 值 得 
一 提 的 是 ， 这 个 时 间 不 是 指 对 象 创建 或 者 最 后 修改 的 时 间 ， 而 是 服务 器 从 它 的 文件 系统 中 
检索 到 该 对 象 ， 将 该 对 象 插入 响应 报 文 ， 并 发 送 该 响应 报 文 的 时 间 。Server: 首部 行 指示 
该 报 文 是 由 一 台 Apache Web 服务 器 产生 的 ， 它 类 似 于 HTTP 请 求 报 文中 的 User-agent: 首 
部 行 。Last- Modified: 首部 行 指示 了 对 象 创建 或 者 最 后 修改 的 日 期 和 时 间 。Last- Modified; 
首部 行 对 既 可 能 在 本 地 客户 也 可 能 在 站 
网 络 缓存 服务 器 上 的 对 象 缓存 来 说 非 par 版 本 |sp| a 
常 重要 。 我 们 将 很 快 详细 地 讨论 缓存 ; 
服务 器 〈 也 叫 代理 服务 器 ) Content- -E 
Length: 首部 行 指示 了 被 发 送 对 象 中 的 “T 
字 节 数 。Content- Type: 首部 行 指示 了 ea 
实体 体 中 的 对 象 是 HTML 文本 。( 该 对 S- 
象 类 型 应 该 正式 地 由 Content- Type: 首 ig 
部 行 而 不 是 用 文件 扩展 名 来 指示 。) AT 

看 过 一 个 例子 后 ， 我 们 再 来 查看 Ne 
响应 报 文 的 通用 格式 ， 如 图 2-9 所 示 。 P 
该 通用 格式 与 前 面 例子 中 的 响应 报 文 人 
相 匹 配 。 我 们 补充 说 明 一 下 状态 码 和 它们 对 应 的 短语 。 状 态 码 及 其 相应 的 短语 指示 了 请 求 
的 结果 。 一 些 常 见 的 状态 码 和 相关 的 短语 包括 : 

e 200 OK: 请 求 成 功 ， 信 息 在 返回 的 响应 报 文中 。 

e 301 Moved Permanently; 请 求 的 对 象 已 经 被 永久 转移 了 ， 新 的 URL 定义 在 响应 报 

文 的 Location: 首部 行 中 。 客 户 软件 将 自动 获取 新 的 URL。 

e 400 Bad Request; 一 个 通用 差错 代码 ， 指 示 该 请 求 不 能 被 服务 器 理解 。 

© 404 Not Found; 被 请 求 的 文档 不 在 服务 器 上 。 

e 505 HTTP Version Not Supported; 服务 器 不 支持 请 求 报 文 使 用 的 HTTP 协议 版 本 。 

你 想 看 一 下 真实 的 HTTP 响应 报 文 吗 ? 这 正 是 我 们 高 度 推荐 而 且 也 很 容易 做 到 的 事 。 
首先 用 Telnet 登录 到 你 喜欢 的 Web 服务 器 上 ， 接 下 来 输入 一 个 只 有 一 行 的 请 求 报 文 去 请 求 
放 在 该 服务 器 上 的 某 些 对 象 。 例 如 ， 假 设 你 看 到 命令 提示 ， 键 和 人: 
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telnet gaia.cs.umass.edu 80 


GET /kurose_ross/interactive/index.php HTTP/1.1 
Host: gaia.cs.umass.edu 


(在 输入 最 后 一 行 后 连续 按 两 次 回 车 .) 这 就 打开 一 个 到 主机 gaia. cs. umass. edu 的 80 
端口 的 TCP 连接 ， 并 发 送 一 个 HTTP 请 求 报 文 。 你 将 会 看 到 一 个 携带 包括 本 书 交 互 式 课 后 
作业 的 基本 HTML 文件 的 响应 报 文 。 如 果 你 只 是 想 看 一 下 HTTP 协议 的 报 文 行 ， 而 不 是 获 
取 对 象 本 身 的 话 ， 那 么 可 以 用 HEAD 代替 GET, 

在 本 节 中 ， 我们 讨论 了 HTTP 请 求 报 文 和 响应 报 文中 的 一 些 首 部 行 。HTTP 规范 中 定 
义 了 许 许多 多 的 首部 行 ， 这 些 首部 行 可 以 被 浏览 器 、Web 服务 器 和 Web 缓存 服务 器 插入 。 
我 们 只 提 到 了 全 部 首部 行 中 的 少数 几 个 ,在 2. 2.5 节 中 我 们 讨论 网 络 Web 缓存 时 还 会 涉及 
其 他 几 个 。 一 本 可 读 性 很 强 的 文献 是 [ Krishnamurty 2001] ， 它 对 HTTP 协议 〈 包 括 它 的 首 
部 行 和 状态 码 ) 进行 了 广泛 讨论 。 

浏览 器 是 如 何 决定 在 一 个 请 求 报 文 中 包含 哪些 首部 行 的 呢 ? Web 服务 器 又 是 如 何 决定 
在 一 个 响应 报 文 中 包含 哪些 首部 行 呢 ? 浏览 器 产生 的 首部 行 与 很 多 因素 有 关 ， 包 括 浏览 器 
的 类 型 和 协议 版 本 (例如 ，HTTP/1.0 浏览 器 将 不 会 产生 任何 1.1 版 本 的 首部 行 ) 、 浏 览 器 
的 用 户 配置 (如 喜好 的 语言 )、 浏 览 器 当前 是 否 有 一 个 缓存 的 但 是 可 能 超期 的 对 象 版 本 。 
Web 服务 器 的 表现 也 类 似 : 在 产品 、 版 本 和 配置 上 都 有 差异 ， 所 有 这 些 都 会 影响 响应 报 文 
中 包含 的 首部 行 。 


2.2.4 ”用 户 与 服务 器 的 交互 : cookie 


我 们 前 面 提 到 了 HTTP 服务 器 是 无 状态 的 。 这 简化 了 服务 器 的 设计 ， 并 且 人 允许 工程 师 
们 去 开发 可 以 同时 处 理 数 以 千 计 的 TCP 连接 的 高 性 能 Web 服务 器 。 然 而 一 个 Web 站 点 通 
常 希望 能 够 识别 用 户 ， 可 能 是 因为 服务 器 希望 限制 用 户 的 访问 ， 或 者 因为 它 希望 把 内 容 与 
用 户 身 份 联系 起 来 。 为 此 ，HTTP 使 用 了 cookie, cookie Æ [RFC 6265] 中 定义 ， 它 允许 
站 点 对 用 户 进行 跟踪 。 目 前 大 多 数 商 务 Web 站 点 都 使 用 了 cookie, 

如 图 2-10 所 示 ，cookie 技术 有 4 个 组 件 : DHE HTTP 响应 报 文 中 的 一 个 cookie 首部 
行 ; OE HTTP 请 求 报 文中 的 一 个 cookie 首部 行 ; @ 在 用 户 端 系统 中 保留 有 一 个 cookie X 
件 ， 并 由 用 户 的 浏览 器 进行 管理 ，@ 位 于 Web 站 点 的 一 个 后 端 数据 库 。 使 用 图 2-10， 我 
们 通过 一 个 典型 的 例子 看 看 cookie 的 工作 过 程 。 假 设 Susan 总 是 从 家 中 PC 使 用 Internet 
Explorer 上 网 ， 她 首次 与 Amazon. com 联系 。 我 们 假定 过 去 她 已 经 访问 过 eBay 站 点 。 当 请 
求 报 文 到 达 该 Amazon Web 服务 器 时 ， 该 Web 站 点 将 产生 一 个 唯一 识别 码 ， 并 以 此 作为 索 
引 在 它 的 后 端 数据 库 中 产生 一 个 表 项 。 接 下 来 Amazon Web 服务 器 用 一 个 包含 Set-cookie: 
首部 的 HTTP 响应 报 文 对 Susan 的 浏览 器 进行 响应 ， 其 中 Set- cookie: 首部 含有 该 识别 码 。 
例如 ， 该 首部 行 可 能 是 
Set-cookie: 1678 

当 Susan 的 浏览 器 收 到 了 该 HTTP 响应 报 文 时 ， 它 会 看 到 该 Set- cookie: 首部 。 该 浏览 
器 在 它 管理 的 特定 cookie 文件 中 添加 一 行 ， 该 行 包含 服务 器 的 主机 名 和 在 Set- cookie: 首部 
中 的 识别 码 。 值 得 注意 的 是 该 cookie 文件 已 经 有 了 用 于 eBay 的 表 项 ， 因 为 Susan 过 去 访问 过 
该 站 点 。 当 Susan 继续 浏览 Amazon 网 站 时 ， 每 请 求 一 个 Web 页 面 ， 其 浏览 器 就 会 查询 该 
cookie 文件 并 抽取 她 对 这 个 网 站 的 识别 码 ， 并 放 到 HTTP 请 求 报 文中 包括 识别 码 的 cookie 首 
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部 行 中 。 特 别 是 ， 发 往 该 Amazon 服务 器 的 每 个 HTTP 请 求 报 文 都 包括 以 下 首部 行 


Cookie: 1678 


在 这 种 方式 下 ，Amazon 服务 器 可 以 跟踪 Susan 在 Amazon 站 点 的 活动 。 尽 管 Amazon 
Web 站 点 不 必 知 道 Susan 的 名 字 ， 但 它 确切 地 知道 用 户 1678 按照 什么 顺序 、 在 什么 时 间 、 
访问 了 哪些 页 面 ! Amazon 使 用 cookie 来 提供 它 的 购物 车 服务 ， 即 Amazon 能 够 维护 Susan 
希望 购买 的 物品 列表 ， 这 样 在 Susan 结束 会 话 时 可 以 一 起 为 它们 付费 。 











客户 主机 服务 器 主机 
人 
fh Bi 
ebay:8734 TTP ey : 
x :— 服务 器 为 用 户 
: wise ant : ”创建 ID 1678 
Sevcod ri : 后 端 数据 库 中 的 表 项 
re 通 HTT : 
amazon: 1678 : okie: ER A 
ebay: 8734: oe 访问 
: are h aS 
一 星期 后 -| : tan : 
一 | 访问 
amazon: 1678 ; ;_ cookie 特定 
ebay: 8734 ss: pHni : 动作 
+ + 
时 间 时 间 
图 例 : 


cookie 文 件 
2-10 用 cookie 跟踪 用 户 状态 


如 果 Susan 再 次 访问 Amazon 站 点 ， 比 如 说 一 个 星期 后 ， 她 的 浏览 器 会 在 其 请 求 报 文 
中 继续 放 人 首部 行 cookie: 1678, Amazon 将 根据 Susan 过 去 在 Amazon 访问 的 网 页 向 她 推 
荐 产品 。 如 果 Susan 也 在 Amazon 注册 过 ， 即 提供 了 她 的 全 名 、 电 子 邮件 地 址 、 邮 政 地 址 
和 信用 卡 账号 ， 则 Amazon 能 在 其 数据 库 中 包括 这 些 信息 ， 将 Susan 的 名 字 与 识别 码 相关 
联 ( 以 及 她 在 过 去 访问 过 的 本 站 点 的 所 有 页 面 ) 。 这 就 解释 了 Amazon 和 其 他 一 些 电子 商 
务 网 站 实现 “点 击 购 物 ”( one-click shopping) 的 道理 ， 即 当 Susan 在 后 继 的 访问 中 选择 购 
买 某 个 物品 时 ， 她 不 必 重 新 输入 姓名 、 信 用 卡 账号 或 者 地 址 等 信息 了 。 

从 上 述 讨论 中 我 们 看 到 ，cookie 可 以 用 于 标识 一 个 用 户 。 用 户 首次 访问 一 个 站 点 时 ， 可 
能 需要 提供 一 个 用 户 标识 (可 能 是 名 字 )。 在 后 继 会 话 中 ,浏览 器 向 服务 器 传递 一 个 cookie 
首部 ， 从 而 向 该 服务 器 标识 了 用 户 。 因 此 cookie 可 以 在 无 状态 的 HTTP 之 上 建立 一 个 用 户 会 
话 层 。 例 如 ， 当 用 户 向 一 个 基于 Web 的 电子 邮件 系统 (如 Hotmail) 注册 时 ， 浏 览 器 向 服务 
器 发 送 cookie 信息 ， 人 允许 该 服务 器 在 用 户 与 应 用 程序 会 话 的 过 程 中 标识 该 用 户 。 
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尽管 cookie 常常 能 简化 用 户 的 因特网 购物 活动 ， 但 是 它 的 使 用 仍 具有 争议 ， 因 为 它们 
被 认为 是 对 用 户 隐私 的 一 种 侵害 。 如 我 们 刚才 所 见 ， 结 合 cookie 和 用 户 提供 的 账户 信息 ， 
Web 站 点 可 以 知道 许多 有 关 用 户 的 信息 ， 并 可 能 将 这 些 信息 卖 给 第 三 方 。Cookie Central 
[ Cookie Central 2016] 包括 了 对 cookie 争论 的 广泛 信息 。 


2.2.5 Web 缓存 


Web 缓存 器 (Web cache) 也 叫 代理 E 
服务 器 (proxy server) ， 它 是 能 够 代表 初 日 “rr, 代理 E F 
始 Web 服务 器 来 满足 HTTP 请 求 的 网 络 实 ~ .Wie Wg LJ 
tk, Web 缓存 器 有 自己 的 磁盘 存储 空间 ， ZPO ge 上- AR 初始 
并 在 存储 空间 中 保存 最 近 请 求 过 的 对 象 的 F 
副本 。 如 图 2-11 所 示 ， 可 以 配置 用 户 的 浏 rt | 


览 器 ,使 得 用 户 的 所 有 HTTP 请 求 首先 指 A Ne 
向 Web 缓存 器 。 一 旦 某 浏览 器 被 配置 每 i i 
个 对 某 对 象 的 浏览 器 请 求 首先 被 定向 到 该 


Web 缓存 器 。 举 例 来 说 ， 假 设 浏 览 器 正在 “客户 初始 - 
请 求 对 象 http://www. someschool. edu/ 服务 器 
campus. git， 将 会 发 生 如 下 情况 : 图 2-11 客户 通过 Web 缓存 器 请 求 对 象 


1) 浏览 器 创建 一 个 到 Web 缓存 器 
的 TCP 连接 ， 并 向 Web 缓存 器 中 的 对 象 发 送 一 个 HTTP 请 求 。 

2) Web 缓存 器 进行 检查 ， 看 看 本 地 是 否 存储 了 该 对 象 副本 。 如 果 有 ，Web 缓存 器 就 
向 客户 浏览 器 用 HTTP 响应 报 文 返回 该 对 象 。 

3) WR Web 缓存 器 中 没有 该 对 象 ， 它 就 打开 一 个 与 该 对 象 的 初始 服务 器 ( 即 
www. someschool. edu) 的 TCP 连接 。Web 缓存 器 则 在 这 个 缓存 器 到 服务 器 的 TCP 连接 上 发 
送 一 个 对 该 对 象 的 HTTP 请 求 。 在 收 到 该 请 求 后 ， 初 始 服务 器 向 该 Web 缓存 器 发 送 具 有 该 
对 象 的 HTTP 响应 。 

4) 当 Web 缓存 器 接收 到 该 对 象 时 ， 它 在 本 地 存储 空间 存储 一 份 副本 ， 并 向 客户 的 浏览 
器 用 HTTP 响应 报 文 发 送 该 副本 (通过 现 有 的 客户 浏览 器 和 Web 缓存 器 之 间 的 TCP 连接 ) 。 

值得 注意 的 是 Web 缓存 器 既是 服务 器 又 是 客户 。 当 它 接收 浏览 器 的 请 求 并 发 回响 应 
时 ， 它 是 一 个 服务 器 。 当 它 向 初始 服务 器 发 出 请 求 并 接收 响应 时 ， 它 是 一 个 客户 。 

Web 缓存 器 通常 由 ISP 购买 并 安装 。 例 如 ， 一 所 大 学 可 能 在 它 的 校园 网 上 安装 一 台 绥 
存 器 ， 并 且 将 所 有 校园 网 上 的 用 户 浏览 器 配置 为 指向 它 。 或 者 ， 一 个 主要 的 住宅 ISP ( 例 
如 Comcast) 可 能 在 它 的 网 络 上 安装 一 台 或 多 台 Web 缓存 器 ， 并 且 预 先 配置 其 配套 的 浏览 
器 指向 这 些 缓存 器 。 

在 因特网 上 部 署 Web 缓存 器 有 两 个 原因 。 首 先 ，Web 缓存 器 可 以 大 大 减少 对 客户 请 
求 的 响应 时 间 ， 特 别 是 当 客 户 与 初始 服务 器 之 间 的 瓶颈 带宽 远 低 于 客户 与 Web 缓存 器 之 
间 的 瓶颈 带宽 时 更 是 如 此 。 如 果 在 客户 与 Web 缓存 器 之 间 有 一 个 高 速 连接 (情况 常常 如 
W), 并且 如 果 用 户 所 请 求 的 对 象 在 Web 缓存 器 上 ， 则 Web 缓存 器 可 以 迅速 将 该 对 象 交付 
给 用 户 。 其 次 ， 如 我 们 马上 用 例子 说 明 的 那样 ，Web 缓存 器 能 够 大 大 减少 一 个 机 构 的 接 人 
链 路 到 因特网 的 通信 量 。 通 过 减少 通信 量 ， 该 机 构 ( 如 一 家 公司 或 者 一 所 大 学 ) 就 不 必 急 
于 增加 带宽 ， 因 此 降低 了 费用 。 此 外 ，Web 缓存 器 能 从 整体 上 大 大 减低 因特网 上 的 Web 





流量 ， 从 而 改善 了 所 有 应 用 的 性 能 。 


为 了 深刻 理解 缓存 器 带 来 的 好 处 ， 我 们 考虑 在 图 2-12 场景 下 的 一 个 例子 。 该 图 显示 


了 两 个 网 络 ， 即 机 构 〈 内 部 ) 网 络 和 公共 因特网 的 一 部 分 。 机 构 网 络 是 一 个 高 速 的 局 域 网 ， 
它 的 一 台 路 由 器 与 因特网 上 的 一 台 路 由 器 通过 一 条 15Mbps 的 链 路 连接 。 这 些 初 始 服务 咒 与 


因特网 相连 但 位 于 全 世界 各 地 。 假 设 对 象 的 平均 长 
度 为 1Mb ， 从 机 构 内 的 浏览 器 对 这 些 初 始 服务 器 的 
平均 访问 速率 为 每 秒 15 个 请 求 。 假 设 HTTP 请 求 
报 文 小 到 可 以 忽略 ， 因 而 不 会 在 网 络 中 以 及 接 人 链 
路 (从 机 构 内 部 路 由 器 到 因特网 路 由 器 ) 上 产生 什 
么 通信 量 。 我 们 还 假设 在 图 2-12 中 从 因特网 接 入 链 
路 一 侧 的 路 由 器 转发 HTTP 请 求 报 文 (在 一 个 全数 
据 报 中 ) 开始 ， 到 它 收 到 其 响应 报 文 (通常 在 多 个 
IP 数据 报 中 ) 为 止 的 时 间 平 均 为 2 秒 。 我 们 非 正 式 
地 将 该 持续 时 延 称 为 “因特网 时 延 ”。 

总 的 响应 时 间 ， 即 从 浏览 器 请 求 一 个 对 象 到 接 
收 到 该 对 象 为 止 的 时 间 ， 是 局 域 网 时 延 、 接 入 时 延 
( 即 两 台 路 由 器 之 间 的 时 延 ) 和 因特网 时 延 之 和 。 
我 们 来 粗略 地 估算 一 下 这 个 时 延 。 局 域 网 上 的 流量 
强度 (参见 1.4.2 节 ) 为 
(15 个 请 求 /s) x (1Mb/ 请 求 )/(100Mbps) = 0. 15 

然而 接 人 链 路 上 的 流量 强度 〈 从 因特网 路 由 器 
到 机 构 路 由 器 ) 为 
(15 个 请 求 /s) x (1Mb/ 请 求 )/(15Mbps) = 1 
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图 2-12 一 个 机 构 网 络 与 因特网 之 间 的 瓶颈 


局 域 网 上 强度 为 0. 15 的 通信 量 通常 最 多 导致 数 十 毫秒 的 时 延 ， 因 此 我 们 可 以 忽略 局 


域 网 时 延 。 然 而 ， 如 在 1. 4. 2 节 讨 论 的 那样 ， 如 果 
流量 强度 接近 1 (就 像 在 图 2-12 中 接 入 链 路 的 情 
况 那 样 )， 链 路 上 的 时 延 会 变 得 非常 大 并 且 无 限 增 
长 。 因 此 ,满足 请 求 的 平均 响应 时 间 将 在 分 钟 的 
量 级 上 。 显 然 ， 必 须 想 办 法 来 改进 时 间 响 应 特性 。 

一 个 可 能 的 解决 办 法 就 是 增加 接 入 链 路 的 速率 ， 
如 从 15Mbps 增加 到 100Mbps。 这 可 以 将 接 入 链 路 上 
的 流量 强度 减少 到 0. 15， 这 样 一 来 ， 两 台 路 由 器 之 
间 的 链 路 时 延 也 可 以 忽略 了 。 这 时 ， 总 的 响应 时 间 
将 大 约 为 2 秒 ， 即 为 因特网 时 延 。 但 这 种 解决 方案 
也 意味 着 该 机 构 必须 将 它 的 接 入 链 路 由 15Mbps 升级 
为 100Mbps， 这 是 一 种 代价 很 高 的 方案 。 

现在 来 考虑 另 一 种 解决 方案 ， 即 不 升级 链 路 
带宽 而 是 在 机 构 网 络 中 安装 一 个 Web 缓存 器 。 这 
种 解决 方案 如 图 2-13 所 示 。 实 践 中 的 命中 率 (B 
由 一 个 缓存 器 所 满足 的 请 求 的 比率 ) 通常 在 0.2 ~ 
0.7 之 间 。 为 了 便于 阐述 ,我们 假设 该 机 构 的 缓存 
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命中 率 为 0.4。 因 为 客户 和 缓存 连接 在 一 个 相同 的 高 速 局 域 网 上 ， 这 样 40% 的 请 求 将 几乎 
立即 会 由 缓存 器 得 到 响应 ， 时 延 约 在 10ms WA. Ail, MPH 60% 的 请 求 仍 然 要 由 初始 
服务 器 来 满足 。 但 是 只 有 60% 的 被 请 求 对 象 通过 接 人 链 路 ， 在 接 人 链 路 上 的 流量 强度 从 
1. 0 减 小 到 0.6。 一 般 而 言 ， 在 15Mbps 链 路 上 ， 当 流量 强度 小 于 0. 8 时 对 应 的 时 延 较 小 ， 
约 为 几 十 毫秒 。 这 个 时 延 与 2 秒 因特网 时 延 相 比 是 微不足道 的 。 考 虑 这 些 之 后 ， 平 均 时 延 
因此 为 

0.4 x (0.010 #) +0.6 x (2.01 #) 

这 上 略 大 于 1.2 秒 。 因 此 ， 第 二 种 解决 方案 提供 的 响应 时 延 甚至 比 第 一 种 解决 方案 更 
低 ， 也 不 需要 该 机 构 升 级 它 到 因特网 的 链 路 。 该 机 构 理所当然 地 要 购买 和 安装 Web 缓存 
器 。 除 此 之 外 其 成 本 较 低 ， 很 多 缓存 器 使 用 了 运行 在 廉价 PC 上 的 公共 域 软件 。 

通过 使 用 内 容 分 发 网 络 (Content Distribution Network, CDN), Web 缓存 器 正在 因特网 
中 发 挥 着 越 来 越 重要 的 作用 。CDN 公司 在 因特网 上 安装 了 许多 地 理 上 分 散 的 缓存 器 ， 因 而 
使 大 量 流量 实现 了 本 地 化 。 有 多 个 共享 的 CDN (例如 Akamai 和 Limelight) 和 专用 的 CDN 
(例如 谷歌 和 Netflixz) 。 我 们 将 在 2. 6 节 中 更 为 详细 地 讨论 CDN, 


2.2.6 条 件 GET 方法 


尽管 高 速 缓存 能 减少 用 户 感受 到 的 响应 时 间 ， 但 也 引入 了 一 个 新 的 问题 ， 即 存放 在 组 
存 器 中 的 对 象 副 本 可 能 是 陈旧 的 。 换 句 话 说， 保存 在 服务 器 中 的 对 象 自 该 副本 缓存 在 客户 
上 以 后 可 能 已 经 被 修改 了 。 幸 运 的 是 ，HTTP 协议 有 一 种 机 制 ， 人 允许 缓存 器 证 实 它 的 对 象 
是 最 新 的 。 这 种 机 制 就 是 条 件 GET (conditional GET) 方法 。 如 果 : 中 请 求 报 文 使 用 CET 
方法 ; 并 且 @ 请 求 报 文中 包含 一 个 “If- Modified- Since:” 首 部 行 。 那 么 ， 这 个 HTTP 请 求 
报 文 就 是 一 个 条 件 GET 请 求 报 文 。 

为 了 说 明 GET 方法 的 操作 方式 ， 我 们 看 一 个 例子 。 首 先 ， 一 个 代理 缓存 器 (proxy 
cache) 代表 一 个 请 求 浏览 器 ， 向 某 Web 服务 器 发 送 一 个 请 求 报 文 : 


GET /fruit/kiwi.gif HTTP/1.1 
Host: www.exotiquecuisine.com 


其 次 ,该 Web 服务 器 向 缓存 器 发 送 具 有 被 请 求 的 对 象 的 响应 报 文 : 


HTTP/1.1 200 OK 

Date: Sat, 3 Oct 2015 15:39:29 

Server: Apache/1.3.0 (Unix) 
Last-Modified: Wed, 9 Sep 2015 09:23:24 
Content-Type: image/gif 


(data data data data data ...) 


该 缓存 器 在 将 对 象 转发 到 请 求 的 浏览 器 的 同时 ， 也 在 本 地 缓存 了 该 对 象 。 重 要 的 是 ， 
缓存 器 在 存储 该 对 象 时 也 存储 了 最 后 修改 日 期 。 最 后 ， 一 个 星期 后 ， 另 一 个 用 户 经 过 该 组 
存 器 请 求 同 一 个 对 象 ， 该 对 象 仍 在 这 个 缓存 器 中 。 由 于 在 过 去 的 一 个 星期 中 位 于 Web 服 
务 器 上 的 该 对 象 可 能 已 经 被 修改 了 ， 该 缓存 器 通过 发 送 一 个 条 件 GET 执行 最 新 检查 。 具 
体 来 说 ， 该 缓存 器 发 送 : 


GET /fruit/kiwi.gif HTTP/1.1 
Host: www.exotiquecuisine.com 
If-modified-since: Wed, 9 Sep 2015 09:23:24 


值得 注意 的 是 下 Modified-Sinece: 首部 行 的 值 正好 等 于 一 星期 前 服务 器 发 送 的 响应 报 文 
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中 的 Last-Modified: 首部 行 的 值 。 该 条 件 GET 报 文 告诉 服务 器 ， 仅 当 自 指定 日 期 之 后 该 对 
象 被 修改 过 ， 才 发 送 该 对 象 。 假 设 该 对 和 象 自 2015 年 9 月 9 日 09: 23: 24 后 没有 被 修改 。 
接 下 来 的 第 四 步 ，Web 服务 器 向 该 缓存 器 发 送 一 个 响应 报 文 ， 


HTTP/1.1 304 Not Modified 
Date: Sat, 10 Oct 2015 15:39:29 
Server: Apache/1.3.0 (Unix) 


(empty entity body) 


我 们 看 到 ， 作 为 对 该 条 件 CET 方法 的 响应 ， 该 Web 服务 器 仍 发 送 一 个 响应 报 文 ， 但 
并 没有 在 该 响应 报 文 中 包含 所 请 求 的 对 象 。 包含 该 对 象 只 会 浪费 带宽 ， 并 增加 用 户 感 受到 
的 响应 时 间 ， 特 别 是 如 果 该 对 象 很 大 的 时 候 更 是 如 此 。 值 得 注意 的 是 在 最 后 的 响应 报 文 
中 ， 状 态 行 中 为 304 Not Modified ， 它 告诉 缓存 器 可 以 使 用 该 对 象 ， 能 向 请 求 的 浏览 器 转发 
它 〈 该 代理 缓存 器 ) 缓存 的 该 对 象 副本 。 

我 们 现在 完成 了 对 HTTP 的 讨论 ， 这 是 我 们 详细 学 习 的 第 一 个 因特网 协议 (应 用 层 协 
议 ) 。 我 们 已 经 学 习 了 HTTP 报 文 的 格式 ， 学 习 了 当 发 送 和 接收 这 些 报 文 时 Web 客户 和 服 
务 器 所 采取 的 动作 。 我 们 还 学 习 了 一 点 Web 应 用 程序 基础 设施 ， 包 括 缓存 、cookie 和 后 端 
数据 库 ， 所 有 这 些 都 以 某 种 方式 与 HTTP 协议 有 关 。 


2.3 因特网 中 的 电子 邮件 


自从 有 了 因特网 ， 电 子 邮 件 就 在 因特网 上 流行 起 来 。 当 因特网 还 在 寝 宰 中 时 ， 电 子 邮 
件 已 经 成 为 最 为 流行 的 应 用 程序 [Segaller 1998 ] ， 年 复 一 年 ， 它 变 得 越 来 越 精细 ， 越 来 越 
强大 。 它 仍然 是 当今 因特网 上 最 重要 和 实用 的 应 用 程序 之 一 。 

与 普通 邮件 一 样 ， 电 子 邮件 是 一 种 异步 通信 媒介 ， 即 当 人 们 方便 时 就 可 以 收发 邮件 ， 
不 必 与 他 人 的 计划 进行 协调 。 与 普通 邮件 相 比 ， 电 子 邮 件 更 为 快速 并 且 易 于 分 发 ， 而 且 价 
格 便宜 。 现 代 电 子 邮件 具有 许多 强大 的 特性 ， 包 括 具 有 附件 、 超 链接 、HTML 格式 文本 和 
图 片 的 报 文 。 

在 本 节 中 ， 我 们 将 讨论 位 于 因特网 电子 邮件 的 核心 地 位 的 应 用 层 协 议 。 在 深入 讨论 这 
些 应 用 层 协 议 之 前 ， 我 们 先 总 体 上 看 看 因特网 电子 邮件 系统 和 它 的 关键 组 件 。 

图 2-14 给 出 了 因特网 电子 邮件 系统 的 总 体 情况 。 从 该 图 中 我 们 可 以 看 到 它 有 3 
个 主要 组 成 部 分 : 用 户 代 理 (user agent) 、 邮 件 服务 器 (mail server) 和 简单 邮件 传输 
协议 (Simple Mail Transfer Protocol，SMTP) 。 下 面 我 们 结合 发 送 方 Alice 发 电子 邮件 给 
接收 方 Bob 的 场景 ， 对 每 个 组 成 部 分 进行 描述 。 用 户 代理 允许 用 户 阅 读 、 回 复 、 转 
发 、 保 存 和 撰写 报 文 。 微 软 的 Outlook 和 Apple Mail 是 电子 邮件 用 户 代 理 的 例子 。 当 
Alice 完成 邮件 撰写 时 ， 她 的 邮件 代理 向 其 邮件 服务 器 发 送 邮件 ， 此 时 邮件 放 在 邮件 
服务 器 的 外 出 报 文 队 列 中 。 当 Bob 要 阅读 报 文 时 ， 他 的 用 户 代 理 在 其 邮件 服务 器 的 邮 
箱 中 取得 该 报 文 。 

邮件 服务 器 形成 了 电子 邮件 体系 结构 的 核心 。 每 个 接收 方 (如 Bob) 在 其 中 的 某 个 邮 
件 服务 器 上 有 一 个 邮箱 (mailbox), Bob 的 邮箱 管理 和 维护 着 发 送 给 他 的 报 文 。 一 个 典型 
的 邮件 发 送 过 程 是 : 从 发 送 方 的 用 户 代 理 开 始 ， 传 输 到 发 送 方 的 邮件 服务 器 ， 再 传输 到 接 
收 方 的 邮件 服务 器 ， 然 后 在 这 里 被 分 发 到 接收 方 的 邮箱 中 。 当 Bob 要 在 他 的 邮箱 中 读 取 该 
报 文 时 ， 包 含 他 邮箱 的 邮件 服务 器 〈 使 用 用 户 名 和 口令 ) RE] Bob, Alice 的 邮箱 也 必 





须 能 处 理 Bob 的 邮件 服务 器 的 故障 。 如 果 Alice 的 服务 器 不 能 将 邮件 交付 给 Bob 的 服务 器 ， 
Alice 的 邮件 服务 器 在 一 个 报 文 队列 (message queue) 中 保持 该 报 文 并 在 以 后 尝试 再 次 发 
送 。 通 常 每 30 分 钟 左右 进行 一 次 尝试 ; 如 果 几 天 后 仍 不 能 成 功 ， 服 务 器 就 删除 该 报 文 并 
以 电子 邮件 的 形式 通知 发 送 方 (Alice) 。 
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图 例 : 
PSE 外 出 报 文 队列 用 户 邮箱 
图 2-14 因特网 电子 邮件 系统 的 总 体 描述 


SMTP 是 因特网 电子 邮件 中 主要 的 应 用 层 协 议 。 它 使 用 TCP 可 靠 数 据 传输 服务 ， 从 发 
送 方 的 邮件 服务 器 向 接收 方 的 邮件 服务 器 发 送 邮 件 。 像 大 多 数 应 用 层 协 议 一 样 ，SMTP 也 
有 两 个 部 分 : 运行 在 发 送 方 邮件 服务 器 的 客户 端 和 运行 在 接收 方 邮件 服务 器 的 服务 器 端 。 
每 台 邮 件 服务 器 上 既 运 行 SMTP 的 客户 端 也 运行 SMTP 的 服务 器 端 。 当 一 个 邮件 服务 器 向 
其 他 邮件 服务 器 发 送 邮 件 时 ， 它 就 表现 为 SMTP 的 客户 ; 当 邮 件 服务 器 从 其 他 邮件 服务 器 
上 接收 邮件 时 ， 它 就 表现 为 一 个 SMTP 的 服务 器 。 


2.3.1 SMTP 





ey 用户 代理 
[了 





用 户 代理 k 


RFC 5321 给 出 了 SMTP 的 定义 。SMTP 是 因特网 电子 邮件 的 核心 。 如 前 所 述 ， 
SMTP 用 于 从 发 送 方 的 邮件 服务 器 发 送 报 文 到 接收 方 的 邮件 服务 器 。SMTP 问世 的 时 
间 比 HTTP 要 长 得 多 (初始 的 SMTP 协议 的 RFC 可 追溯 到 1982 年 ， 而 SMTP 在 此 之 前 
很 长 一 段 时 间 就 已 经 出 现 了 ) 。 尽 管 电子 邮件 应 用 在 因特网 上 的 独特 地 位 可 以 证 明 
SMTP 有 着 众多 非常 出 色 的 性 质 ， 但 它 所 具有 的 某 种 陈旧 特征 表明 它 仍然 是 一 种 继承 
的 技术 。 例 如 ， 它 限制 所 有 邮件 报 文 的 体 部 分 (不 只 是 其 首部 ) 只 能 采用 简单 的 7 E 
特 ASCII 表示。 在 20 世纪 80 年 代 早期 ， 这 种 限制 是 明智 的 ， 因 为 当时 传输 能 力 不 
足 ， 没 有 人 会 通过 电子 邮件 发 送 大 的 附件 或 是 大 的 图 片 、 声 音 或 者 视频 文件 。 然 而 ， 
在 今天 的 多 媒体 时 代 ，7 位 ASCH 的 限制 的 确 有 点 痛苦 ， 即 在 用 SMTP 传送 邮件 之 前 ， 
需要 将 二 进 制 多 媒体 数据 编码 为 ASCI 码 ， 并 且 在 使 用 SMTP 传输 后 要 求 将 相应 的 





ASCII 码 邮 件 解码 还 原 为 多 媒体 数据 。2. 2 节 讲 过 ， 使 用 HTTP 传送 前 不 需要 将 多 媒 
体 数据 编码 为 ASCI 码 。 

为 了 描述 SMTP 的 基本 操作 ， 我 们 观察 一 种 常见 的 情景 。 假 设 Alice 想 给 Bob 发 送 一 
封 简单 的 ASCII 报 文 。 

1) Alice 调用 她 的 邮件 代理 程序 并 提供 Bob 的 邮件 地 址 (例如 bob@ someschool. edu) , 
撰写 报 文 ， 然 后 指示 用 户 代 理发 送 该 报 文 。 

2) Alice 的 用 户 代理 把 报 文 发 给 她 的 邮件 服务 器 ， 在 那里 该 报 文 被 放 在 报 文 队 列 中 。 

3) 运行 在 Alice 的 邮件 服务 器 上 的 SMTP 客户 端 发 现 了 报 文 队列 中 的 这 个 报 文 ， 它 就 
创建 一 个 到 运行 在 Bob 的 邮件 服务 器 上 的 SMTP 服务 器 的 TCP 连接 。 

4) 在 经 过 一 些 初 始 SMTP 握手 后 ，SMTP 客户 通过 该 TCP 连接 发 送 Alice 的 报 文 。 

5) Æ Bob 的 邮件 服务 器 上 ，SMTP 的 服务 器 端 接 收 该 报 文 。Bob 的 邮件 服务 器 然后 将 
该 报 文 放 和 人 Bob 的 邮箱 中 。 

6) 在 Bob 方便 的 时 候 ， 他 调用 用 户 代 理 阅 读 该 报 文 。 

2-15 总 结 了 上 述 这 个 情况 。 





图 例 : 


NNN 国 用 户 邮 箱 
图 2-15 Alice 向 Bob 发 送 一 条 报 文 


观察 到 下 述 现象 是 重要 的 : SMTP 一 般 不 使 用 中 间 邮 件 服 务 器 发 送 邮件 ， 即 使 这 两 个 
邮件 服务 器 位 于 地 球 的 两 端 也 是 这 样 。 假 设 Alice 的 邮件 服务 器 在 中 国 香港 ， 而 Bob 的 服 
务 器 在 美国 圣路易斯 ， 那 么 这 个 TO 连接 也 是 从 香港 服务 器 到 圣路易斯 服务 器 之 间 的 直接 
相连 。 特 别 是 ， 如 果 Bob 的 邮件 服务 器 没有 开机 ， 该 报 文 会 保留 在 Alice 的 邮件 服务 器 上 
并 等 待 进行 新 的 尝试 ， 这 意味 着 邮件 并 不 在 中 间 的 某 个 邮件 服务 器 存留 。 

我 们 现在 仔细 观察 一 下 ，SMTP 是 如 何 将 一 个 报 文 从 发 送 邮件 服务 器 传送 到 接收 
邮件 服务 器 的 。 我 们 将 看 到 ，SMTP 与 人 类 面对面 交往 的 行为 方式 有 许多 类 似 性 。 首 
先 ， 客户 SMTP (运行 在 发 送 邮 件 服务 器 主机 上 ) 在 25 号 端口 建立 一 个 到 服务 器 
SMTP (运行 在 接收 邮件 服务 器 主机 上 ) AY TCP 连接 。 如 果 服 务 器 没有 开机 ， 客 户 会 
在 稍 后 继续 尝试 连接 。 一 旦 连接 建立 ， 服 务 器 和 客户 执行 某 些 应 用 层 的 握手 ， 就 像 人 
们 在 互相 交流 前 先进 行 自我 介绍 一 样 。SMTP 的 客户 和 服务 器 在 传输 信息 前 先 相互 介 
绍 。 在 SMTP 握手 的 阶段 ，SMTP 客户 指示 发 送 方 的 邮件 地 址 (产生 报 文 的 那个 人 ) 
和 接收 方 的 邮件 地 址 。 一 旦 该 SMTP 客户 和 服务 屁 彼 此 介绍 之 后 ， 客 户 发 送 该 报 文 。 
SMTP 能 依赖 TCP 提供 的 可 靠 数 据 传输 无 差错 地 将 邮件 投递 到 接收 服务 器 。 该 客户 如 
果 有 另外 的 报 文 要 发 送 到 该 服务 器 ， 就 在 该 相同 的 TCP 连接 上 重复 这 种 处 理 ; 和 否则， 
它 指 示 TCP 关闭 连接 。 
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接 下 来 我 们 分 析 一 个 在 SMTP 客户 (C) A SMTP 服务 器 (S) 之 间 交 换 报 文 文本 的 例 
子 。 客 户 的 主机 名 为 crepes. fr, ARF #09 EOLA A hamburger. edu, LAC: 开头 的 ASCI 码 
文本 行 正 是 客户 交 给 其 TCP 套 接 字 的 那些 行 ， 以 $: 开头 的 ASCII 码 则 是 服务 器 发 送 给 其 
TCP 套 接 字 的 那些 行 。 一 旦 创建 了 TCP 连接 ， 就 开始 了 下 列 过 程 。 


S: 220 hamburger.edu 

HELO crepes.fr 

250 Hello crepes.fr, pleased to meet you 
MAIL FROM: <alice@crepes.fr> 

250 alice@crepes.fr ... Sender ok 

RCPT TO: <bob@hamburger.edu> 

250 bob@hamburger.edu ... Recipient ok 
DATA 

354 Enter mail, end with ”.” on a line by itself 
Do you like ketchup? 

How about pickles? 


250 Message accepted for delivery 
QUIT 
221 hamburger.edu closing connection 

在 上 例 中 ， 客 户 从 邮件 服务 器 crepes. fr 向 邮件 服务 器 hamburger. edu 发 送 了 一 个 报 文 
( “Do you like ketchup? How about pickles?”) 。 作 为 对 话 的 一 部 分 ， 该 客户 发 送 了 5 条 命 
令 : HELO (Æ HELLO 的 缩写 ) MAIL FROM, RCPT TO, DATA 以 及 QUIT。 这 些 命令 都 
是 自 解释 的 。 该 客户 通过 发 送 一 个 只 包含 一 个 句点 的 行 ， 向 服务 器 指示 该 报 文 结 束 了 。 
(按照 ASCI 码 的 表示 方法 ， 每 个 报 文 以 CRLF. CRLF 结束 ， 其 中 的 CR 和 LF 分 别 表示 回 
车 和 换行 。) 服务 器 对 每 条 命令 做 出 回答 ， 其 中 每 个 回答 含有 一 个 回答 码 和 一 些 (可 选 
的 ) 英文 解释 。 我 们 在 这 里 指出 SMTP 用 的 是 持续 连接 : 如 果 发 送 邮件 服务 器 有 几 个 报 文 
发 往 同 一 个 接收 邮件 服务 器 ， 它 可 以 通过 同一 个 TCP 连接 发 送 这 些 所 有 的 报 文 。 对 每 个 报 
文 ， 该 客户 用 一 个 新 的 MAIL FROM; crepes. 人 tr 开始 ， 用 一 个 独立 的 句点 指示 该 邮件 的 结 
束 ， 并 且 仅 当 所 有 邮件 发 送 完 后 才 发 送 QUIT. 

我 们 强烈 推荐 你 使 用 Telnet 与 一 个 SMTP 服务 器 进行 一 次 直接 对 话 。 使 用 的 命令 是 


telnet serverName 25 


其 中 serverName 是 本 地 邮件 服务 器 的 名 称 。 当 你 这 么 做 时 ， 就 直接 在 本 地 主机 与 邮件 
服务 器 之 间 建 立 一 个 TCP 连接 。 输 完 上 述 命令 后 ， 你 立即 会 从 该 服务 器 收 到 220 回答 。 接 
下 来 ， 在 适当 的 时 机 发 出 HELO, MAIL FROM, RCPT TO, DATA, CRLF. CRLF 以 及 QUIT 
等 SMTP 命令 。 强 烈 推 荐 你 做 本 章 后 面 的 编程 作业 3。 在 该 作业 中 ， 你 将 在 SMTP 的 客户 
端 实现 一 个 简单 的 用 户 代 理 ， 它 允许 你 经 本 地 邮件 服务 器 向 任意 的 接收 方 发 送 电子 邮件 
报 文 。 


2.3.2 与 HTTP 的 对 比 


我 们 简要 地 比较 一 下 SMTP 和 HTTP。 这 两 个 协议 都 用 于 从 一 台 主 机 向 另 一 台 主 机 传 
送 文 件 : HTTP 从 Web 服务 器 向 Web 客户 (通常 是 一 个 浏览 器 ) 传送 文件 (也 称 为 对 
ZR); SMTP 从 一 个 邮件 服务 器 向 另 一 个 邮件 服务 器 传送 文件 〈 即 电子 邮件 报 文 ) 。 当 进行 
文件 传送 时 ， 持 续 的 HTTP 和 SMTP 都 使 用 持续 连接 。 因 此 ， 这 两 个 协议 有 一 些 共同 特征 。 
然而 ， 两 者 之 间 也 有 一 些 重要 的 区 别 。 首 先 ，HTTP 主要 是 一 个 拉 协 议 (pull protocol) , 
即 在 方便 的 时 候 ， 某 些 人 在 Web 服务 器 上 装载 信息 ， 用 户 使 用 HTTP 从 该 服务 器 拉 取 这 些 
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信息 。 特 别 是 TCP 连接 是 由 想 接收 文件 的 机 器 发 起 的 。 另 一 方面 ，SMTP 基本 上 是 一 个 推 
协议 (push protocol) ， 即 发 送 邮 件 服务 器 把 文件 推 向 接收 邮件 服务 器 。 特 别 是 ， 这 个 TCP 
连接 是 由 要 发 送 该 文件 的 机 器 发 起 的 。 

第 二 个 区 别 就 是 我 们 前 面 间接 地 提 到 过 的 ，SMTP 要 求 每 个 报 文 (包括 它们 的 体 ) 采 
用 7 比特 ASCH 码 格式 。 如 果 某 报 文 包含 了 非 7 比特 AS 字符 (如 具有 重音 的 法 文字 
符 ) 或 二 进 制 数 据 (如 图 形 文件 ) ， 则 该 报 文 必 须 按 照 7 比特 ASCII 码 进行 编码 。HTTP 数 
据 则 不 受 这 种 限制 。 

第 三 个 重要 区 别 是 如 何 处 理 一 个 既 包 含 文本 又 包含 图 形 (也 可 能 是 其 他 媒体 类 型 ) 的 
文档 。 如 我 们 在 2. 2 节 知 道 的 那样 ，HTTP 把 每 个 对 象 封装 到 它 自己 的 HTTP 响应 报 文中 ， 
而 SMTP 则 把 所 有 报 文 对 象 放 在 一 个 报 文 之 中 。 


2.3.3 邮件 报 文 格式 


当 Alice 给 Bob 写 一 封 邮寄 时 间 很 长 的 普通 信件 时 ， 她 可 能 要 在 信 的 上 部 包含 各 种 各 
样 的 环境 首部 信息 ， 如 Bob 的 地 址 、 她 自己 的 回复 地 址 以 及 日 期 等 。 同 样 ， 当 一 个 人 给 田 
一 个 人 发 送 电子 邮件 时 ， 一 个 包含 环境 信息 的 首部 位 于 报 文体 前 面 。 这 些 环境 信息 包括 在 
一 系列 首部 行 中 ， 这 些 行 由 RFC 5322 定义 。 首 部 行 和 该 报 文 的 体 用 空 行 ( 即 回 车 换行 ) 
进行 分 隔 。RFC 5322 定义 了 邮件 首部 行 和 它们 的 语义 解释 的 精确 格式 。 如 同 HTTP 协议 ， 
每 个 首部 行 包含 了 可 读 的 文本 ， 是 由 关键 词 后 跟 冒 号 及 其 值 组 成 的 。 某 些 关 键 词 是 必需 
的 ， 另 一 些 则 是 可 选 的 。 每 个 首部 必须 含有 一 个 From: 首部 行 和 一 个 To: 首部 行 ; 一 个 
首部 也 许 包 含 一 个 Subject: 首部 行 以 及 其 他 可 选 的 首部 行 。 重 要 的 是 注意 到 下 列 事 实 : 这 
些 首部 行 不 同 于 我 们 在 2. 3. 1 节 所 学 到 的 SMTP 命令 (即使 那里 包含 了 某 些 相同 的 词汇 ， 
如 from 和 to)。 那 节 中 的 命令 是 SMTP 握手 协议 的 一 部 分 ; 本 节 中 考察 的 首部 行 则 是 邮件 
报 文 自身 的 一 部 分 。 

一 个 典型 的 报 文 首部 看 起 来 如 下 : 


From: alice@crepes.fr 
To: bob@hamburger.edu 
Subject: Searching for the meaning of life. 


在 报 文 首部 之 后 ， 紧 接着 一 个 空白 行 ， 然 后 是 以 ACS 格式 表示 的 报 文体 。 你 应 当 用 
Telnet 向 邮件 服务 器 发 送 包 含 一 些 首部 行 的 报 文 ， 包 括 Subject: 首部 行 。 为 此 ， 输 入 命令 
telnet serverName 25, ， 如 在 2.3.1 节 中 讨论 的 那样 。 


2.3.4 邮件 访问 协议 


一 旦 SMTP 将 邮件 报 文 从 Alice 的 邮件 服务 器 交付 给 Bob 的 邮件 服务 器 ， 该 报 文 就 被 
WAT Bob 的 邮箱 中 。 在 此 讨论 中 ， 我 们 按 惯 例假 定 Bob 是 通过 登录 到 服务 器 主机 ， 并 直 
接 在 该 主机 上 运行 一 个 邮件 阅读 程序 来 阅读 他 的 邮件 的 。 直 到 20 世纪 90 年 代 早期 ， 这 都 
是 一 种 标准 方式 。 而 在 今天 ， 邮 件 访问 使 用 了 一 种 客户 - 服务 器 体系 结构 ， 即 典型 的 用 户 
通过 在 用 户 端 系统 上 运行 的 客户 程序 来 阅读 电子 邮件 ， 这 里 的 端 系统 可 能 是 办 公 室 的 PC、 
便携 机 或 者 是 智能 手机 。 通 过 在 本 地 主机 上 运行 邮件 客户 程序 ， 用 户 享 受 一 系列 丰富 的 特 
性 ， 包 括 查看 多 媒体 报 文 和 附件 的 能 力 。 

假设 Bob (接收 方 ) 在 其 本 地 PC 上 运行 用 户 代理 程序 ， 考 虑 在 他 的 本 地 PC 上 也 
放置 一 个 邮件 服务 器 是 自然 而 然 的 事 。 在 这 种 情况 下 ，Alice 的 邮件 服务 器 就 能 直接 
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与 Bob 的 PC 进行 对 话 了 。 然 而 这 种 方法 会 有 一 个 问题 。 前 面 讲 过 邮件 服务 器 管理 用 
户 的 邮箱 ， 并 且 运 行 SMTP 的 客户 端 和 服务 器 端 。 如 果 Bob 的 邮件 服务 器 位 于 他 的 PC 
上 ， 那 么 为 了 能 够 及 时 接收 可 能 在 任何 时 候 到 达 的 新 邮件 ， 他 的 PC 必须 总 是 不 间断 
地 运行 着 并 一 直 保 持 在 线 。 这 对 于 许多 因特网 用 户 而 言 是 不 现实 的 。 相 反 ， 典 型 的 用 
户 通常 在 本 地 PC 上 运行 一 个 用 户 代 理 程序 ， 而 它 访问 存储 在 总 是 保持 开机 的 共享 邮 
件 服务 器 上 的 邮箱 。 该 邮件 服务 器 与 其 他 用 户 共享 ， 并 且 通 常 由 用 户 的 ISP 进行 维护 
(如 大 学 或 公司 ) 。 

现在 我 们 考虑 当 从 Alice 向 Bob 发 送 一 个 电子 邮件 报 文 时 所 取 的 路 径 。 我 们 刚才 已 经 
知道 ， 在 沿 着 该 路 径 的 某 些 点 上 ， 需 要 将 电子 邮件 报 文 存放 在 Bob 的 邮件 服务 器 上 。 通 过 
让 Alice 的 用 户 代理 直接 向 Bob 的 邮件 服务 器 发 送 报 文 ， 就 能 够 做 到 这 一 点 。 这 能 够 由 
SMTP 来 完成 : 实际 上 ，SMTP 被 设计 成 将 电子 邮件 从 一 台 主 机 推 到 另 一 台 主 机 。 然 而 ， 通 
常 Alice 的 用 户 代 理 和 Bob 的 邮件 服务 器 之 间 并 没有 一 个 直接 的 SMTP 对 话 。 相 反 ， 如 
图 2-16 所 示 ，Alice 的 用 户 代 理 用 SMTP 将 电子 邮件 报 文 推 人 她 的 邮件 服务 器 ， 接 着 她 的 
邮件 服务 器 (作为 一 个 SMTP 客户 ) 再 用 SMTP 将 该 邮件 中 继 到 Bob 的 邮件 服务 器 。 为 什 
么 该 过 程 要 分 成 两 步 呢 ? 主要 是 因为 不 通过 Alice 的 邮件 服务 器 进行 中 继 ，Alice 的 用 户 代 
理 将 没有 任何 办 法 到 达 一 个 不 可 达 的 目的 地 接收 服务 器 。 通 过 首先 将 邮件 存放 在 自己 的 邮 
件 服务 器 中 ，Alice 的 邮件 服务 器 可 以 重复 地 尝试 向 Bob 的 邮件 服务 器 发 送 该 报 文 ， 如 每 
30 分 钟 一 次 ， 直 到 Bob 的 邮件 服务 器 变 得 运行 为 止 。( 并 且 如 果 Alice 的 邮件 服务 器 关机 ， 
她 则 能 向 系统 管理 员 进 行 申告 !) SMTP RFC 文档 定义 了 如 何 使 用 SMTP 命令 经 过 多 个 
SMTP 服务 器 进行 报 文中 继 。 





图 2-16 电子 邮件 协议 及 其 通信 实体 


但 是 对 于 该 难题 仍然 有 一 个 朴 漏 的 环节 ! 像 Bob 这 样 的 接收 方 ， 是 如 何 通过 运行 其 本 
地 PC 上 的 用 户 代 理 ， 获 得 位 于 他 的 某 ISP 的 邮件 服务 器 上 的 邮件 呢 ? 值得 注意 的 是 Bob 
的 用 户 代 理 不 能 使 用 SMTP 得 到 报 文 ， 因 为 取 报 文 是 一 个 拉 操 作 ， 而 SMTP 协议 是 一 个 推 
协议 。 通 过 引入 一 个 特殊 的 邮件 访问 协议 来 解决 这 个 难题 ， 该 协议 将 Bob 邮件 服务 器 上 的 
报 文 传送 给 他 的 本 地 PC。 目 前 有 一 些 流行 的 邮件 访问 协议 ,包括 第 三 版 的 邮局 协议 (Post 
Office Protocol 一 Version 3，POP3 ) 、 因 特 网 邮件 访问 协议 (Internet Mail Access Protocol, 
IMAP) 以 及 HTTP, 

图 2-16 总 结 了 应 用 于 因特网 电子 邮件 的 一 些 协议 : SMTP 用 来 将 邮件 从 发 送 方 的 邮件 
服务 器 传输 到 接收 方 的 邮件 服务 器 ; SMTP 也 用 来 将 邮件 从 发 送 方 的 用 户 代理 传送 到 发 送 
方 的 邮件 服务 器 。 如 POP3 这 样 的 邮件 访问 协议 用 来 将 邮件 从 接收 方 的 邮件 服务 器 传送 到 
接收 方 的 用 户 代理 。 
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1. POP3 


POP3 是 一 个 极为 简单 的 邮件 访问 协议 ， 由 RFC 1939 进行 定义 。 文 档 RFC 1939 简短 
且 可 读 性 强 。 因 为 该 协议 非常 简单 ， 故 其 功能 相当 有 限 。 当 用 户 代理 (客户 ) 打开 了 一 个 
到 邮件 服务 器 (服务器) 端口 110 上 的 TCP 连接 后 ，POP3 就 开始 工作 了 。 随 着 建立 TCP 
连接 ，POP3 按照 三 个 阶段 进行 工作 : 特许 (authorization) 、 事 务 处 理 以 及 更 新 。 在 第 一 个 
阶段 即 特 许 阶段 ， 用 户 代理 发 送 ( 以 明文 形式 ) 用 户 和 名 和 口令 以 鉴别 用 户 。 在 第 二 个 阶段 
即 事务 处 理 阶 段 ， 用 户 代理 取 回 报 文 ; 同时 在 这 个 阶段 用 户 代理 还 能 进行 如 下 操作 ， 对 报 
文 做 删除 标记 ， 取 消 报 文 删除 标记 ， 以 及 获取 邮件 的 统计 信息 。 在 第 三 个 阶段 即 更 新 阶 
段 ， 它 出 现在 客户 发 出 了 pt 命令 之 后 ， 目 的 是 结束 该 POP3 会 话 ; 这 时 ,该 邮件 服务 器 
删除 那些 被 标记 为 删除 的 报 文 。 

在 POP3 的 事务 处 理 过 程 中 ， 用 户 代理 发 出 一 些 命令 ， 服 务 器 对 每 个 命令 做 出 回答 。 
回答 可 能 有 两 种 : + OK (有 时 后 面 还 跟 有 服务 器 到 客户 的 数据 ) ， 被 服务 器 用 来 指示 前 面 
的 命令 是 正常 的 ; -ERR， 被 服务 器 用 来 指示 前 面 的 命令 出 现 了 某 些 差错 。 

特许 阶段 有 两 个 主要 的 命令 : user <user name > 和 pass < password > 。 为 了 举例 说 明 
这 两 个 命令 ， 我 们 建议 你 直接 用 Telnet 登录 到 POP3 服务 器 的 110 端口 ， 然 后 发 出 这 两 个 
命令 。 假 设 邮件 服务 器 的 名 字 为 mailServer， 那 么 你 将 看 到 类 似 的 过 程 : 


telnet mailServer 110 

+OK POP3 server ready 

user bob 

+OK 

pass hungry 

+OK user successfully logged on 


如 果 你 的 命令 拼写 错 了 ,该 POP3 服务 器 将 返回 一 个 - ERR 报 文 。 

现在 我 们 来 看 一 下 事务 处 理 过程 。 使 用 POPS 的 用 户 代理 通常 被 用 户 配置 为 “下 载 
并 删除 ”或 者 “下 载 并 保留 ”方式 。POP3 用 户 代理 发 出 的 命令 序列 取决 于 用 户 代 理 程 
序 被 配置 为 这 两 种 工作 方式 的 哪 一 种 。 使 用 下 载 并 删除 方式 ， 用 户 代 理发 出 list、retr 和 
dele 命令 。 举 例 来 说 ,假设 用 户 在 他 (她) 的 邮箱 里 有 两 个 报 文 。 在 下 面 的 对 话 中 ， 
C: (RRP) 是 用 户 代理 ，S$: (代表 服务 器 ) 是 邮件 服务 器 。 事 务 处 理 过 程 将 类 似 
于 如 下 过 程 : 


Gs Ist 

S: 1 498 

Se 2 512 

SR 

C: retr 1 

S: (blah blah ... 

Qe aaaea end Re maaiss 
QS core a Ba blah) 

SE a 

C: dele 1 

Cz retr 2 

S: (blah blah 

Siti pina ep divine 
SE de wae awe ws blah) 

St e 

C: dele 2 

C? quit 

S: +OK POP3 server signing off 


用 户 代理 首先 请 求 邮 件 服务 器 列 出 所 有 存储 的 报 文 的 长 度 。 接 着 用 户 代 理 从 邮件 服务 
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器 取 回 并 删除 每 封 邮 件 。 注 意 到 在 特许 阶段 以 后 ， 用 户 代 理 仅 使 用 四 个 命令 list, retr, de- 
le 和 quit， 这 些 命令 的 语法 定义 在 RFC 1939 中 。 在 处 理 quit 命令 后 ，POP3 服务 器 进入 更 
新 阶段 ， 从 用 户 的 邮箱 中 删除 邮件 1 和 2。 

使 用 下 载 并 删除 方式 存在 的 问题 是 ， 邮 件 接收 方 Bob 可 能 是 移动 的 ， 可 能 希望 从 多 个 
不 同 的 机 器 访问 他 的 邮件 报 文 ， 如 从 办 公 室 的 PC、 家 里 的 PC 或 他 的 便携 机 来 访问 邮件 。 
下 载 并 删除 方式 将 对 Bob 的 邮件 报 文 根 据 这 3 台 机 器 进行 划分 ， 特 别 是 如 果 Bob 最 先是 在 
他 办 公 室 的 PC 上 收取 了 一 条 邮件 ,那么 晚上 当 他 在 家 里 时 ， 通 过 他 的 便携 机 将 不 能 再 收 
取 该 邮件 。 使 用 下 载 并 保留 方式 ， 用 户 代理 下 载 某 邮件 后 ， 该 邮件 仍 保留 在 邮件 服务 器 
上 。 这 时 ，Bob 就 能 通过 不 同 的 机 器 重新 读 取 这 些 邮 件 ; 他 能 在 工作 时 收取 一 封 报 文 ， 而 
在 工作 回 家 后 再 次 访问 它 。 

在 用 户 代理 与 邮件 服务 器 之 间 的 POP3 会 话 期 间 ， 该 POP3 服务 器 保留 了 一 些 状 态 信 
息 ; 特别 是 记录 了 哪些 用 户 报 文 被 标记 为 删除 了 。 然 而 ，POP3 服务 器 并 不 在 POP3 会 话 过 
程 中 携带 状态 信息 。 会 话 中 不 包括 状态 信息 大 大 简化 了 POP3 服务 的 实现 。 

2. IMAP 


使 用 POP3 访问 时 ,一旦 Bob 将 邮件 下 载 到 本 地 主机 后 ， 他 就 能 建立 邮件 文件 夹 ， 
并 将 下 载 的 邮件 放 和 人 该 文件 夹 中 。 然 后 Bob 可 以 删除 报 文 ， 在 文件 夹 之 间 移 动 报 文 ， 
并 查询 报 文 (通过 发 送 方 的 名 字 或 报 文 主题 )。 但 是 这 种 文件 夹 和 报 文 存放 在 本 地 主 
机 上 的 方式 ， 会 给 移动 用 户 带 来 问题 ， 因 为 他 更 喜欢 使 用 一 个 在 远程 服务 器 上 的 层次 
文件 夹 ， 这 样 他 可 以 从 任何 一 台 机 器 上 对 所 有 报 文 进行 访问 。 使 用 POP3 是 不 可 能 做 
到 这 一 点 的 ，POP3 协议 没有 给 用 户 提 供 任何 创建 远程 文件 夹 并 为 报 文 指 派 文件 夹 的 
方法 

为 了 解决 这 个 或 其 他 一 些 问 题 ， 由 RFC 3501 定义 的 因特网 邮件 访问 协议 
(IMAP) 应 运 而 生 。 和 POP3 一 样 ，IMAP 是 一 个 邮件 访问 协议 ， 但 是 它 比 POP3 具有 
更 多 的 特色 ， 不 过 也 比 POP3 复杂 得 多 。 (因此 客户 和 服务 器 端的 实现 也 都 复杂 
得 多 。) 

IMAP 服务 器 把 每 个 报 文 与 一 个 文件 夹 联 系 起 来 ; 当 报 文 第 一 次 到 达 服 务 器 时 ， 它 
与 收 件 人 的 INBOX 文件 夹 相关 联 。 收 件 人 则 能 够 把 邮件 移 到 一 个 新 的 、 用 户 创建 的 文 
件 夹 中 ， 阅 读 邮 件 ， 删 除 邮 件 等 。IMAP 协议 为 用 户 提 供 了 创建 文件 夹 以 及 将 邮件 从 一 
个 文件 夹 移 动 到 另 一 个 文件 夹 的 命令 。IMAP 还 为 用 户 提 供 了 在 远程 文件 夹 中 查询 邮件 
的 命令 ， 按 指定 条 件 去 查询 匹配 的 邮件 。 值 得 注意 的 是 ， 与 POP3 不 同 ，IMAP 服务 器 
维护 了 IMAP 会 话 的 用 户 状 态 信 息 ， 例 如 ， 文 件 夹 的 名 字 以 及 哪些 报 文 与 哪些 文件 夹 相 
关联 。 

IMAP 的 另 一 个 重要 特性 是 它 具 有 人 允许 用 户 代理 获取 报 文 某 些 部 分 的 命令 。 例 如 ， 一 
个 用 户 代理 可 以 只 读 取 一 个 报 文 的 报 文 首 部 ， 或 只 是 一 个 多 部 分 MIME 报 文 的 一 部 分 。 当 
用 户 代理 和 其 邮件 服务 器 之 间 使 用 低 带 宽 连 接 (如 一 个 低速 调制 解 调 器 链 路 ) 的 时 候 ， 这 
个 特性 非常 有 用 。 使 用 这 种 低 带 宽 连 接 时 ， 用 户 可 能 并 不 想 取 回 他 邮箱 中 的 所 有 邮件 ， 尤 
其 要 避免 可 能 包含 如 音频 或 视频 片断 的 大 邮件 。 

3. 基于 Web 的 电子 邮件 


今天 越 来 越 多 的 用 户 使 用 他 们 的 Web 浏览 器 收发 电子 邮件 。20 世纪 90 年 代 中 期 
Hotmail 引入 了 基于 Web 的 接 入 。 今 天， 谷歌、 雅虎 以 及 几乎 所 有 重要 的 大 学 或 者 公 
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司 也 提供 了 基于 Web 的 电子 邮件 。 使 用 这 种 服务 ， 用 户 代 理 就 是 普通 的 浏览 器 ， 用 
户 和 他 远程 邮箱 之 间 的 通信 则 通过 HTTP 进行 。 当 一 个 收 件 人 (如 Bob)， 想 从 他 的 
邮箱 中 访问 一 个 报 文 时 ， 该 电子 邮件 报 文 从 Bob 的 邮件 服务 器 发 送 到 他 的 浏览 器 ， 使 
用 的 是 HTTP 而 不 是 POP3 或 者 IMAP 协议 。 当 发 件 人 (如 Alice) 要 发 送 一 封 电子 邮 
件 报 文 时 ， 该 电子 邮件 报 文 从 Alice 的 浏览 器 发 送 到 她 的 邮件 服务 器 ， 使 用 的 是 HTTP 
而 不 是 SMTP。 然 而 ，Alice 的 邮件 服务 器 在 与 其 他 的 邮件 服务 器 之 间 发 送 和 接收 邮件 
时 ,仍然 使 用 的 是 SMTP, 


2.4 DNS: 因特网 的 目录 服务 


人 类 能 以 很 多 方式 来 标识 。 例 如 ， 我 们 能 够 通过 出 生 证 书 上 的 名 字 来 标识 ; 能 够 通过 
社会 保险 号 码 来 标识 ; 也 能 够 通过 驾驶 执照 上 的 号 码 来 标识 。 尽 管 这 些 标识 办 法 都 可 以 用 来 
识别 一 个 人 ， 但 是 在 特定 环境 下 ， 某 种 识别 方法 可 能 比 另 一 种 方法 更 为 适合 。 例 如 ，IRS 
(美国 那个 声名 狼藉 的 税务 征收 机 构 ) 的 计算 机 更 喜欢 使 用 定 长 的 社会 保险 号 码 而 不 是 出 生 
证 书 上 的 姓名 。 男 一 方面 ， 普 通 人 乐于 使 用 更 好 记 的 出 生 证 书 上 的 姓名 而 不 是 社会 保险 号 
码 。( 毫 无 疑问 ， 你 能 想象 人 们 之 间 以 这 种 方式 说 话 吗 ? 如 “你 好 ， 我 叫 132-67-9875。 请 找 
一 下 我 的 丈夫 178-87-1146”,) 

因特网 上 的 主机 和 人 类 一 样 ， 可 以 使 用 多 种 方式 进行 标识 。 主 机 的 一 种 标识 方法 是 用 
ENEMA (hostname)， 如 www. facebook. com, www. google. com, gaia. cs. umass. edu 以 
及 cis. poly. edu 等 ， 这 些 名 字 便 于 记忆 也 乐于 被 人 们 接受 。 然 而 ， 主 机 名 几乎 没有 提供 
(即使 有 也 很 少 ) 关于 主机 在 因特网 中 位 置 的 信息 。 (一 个 名 为 www. eurecom. fr 的 主机 以 
国家 码 .全 结束 ， 告 诉 我 们 该 主机 很 可 能 在 法 国 ， 仅 此 而 已 。) 况且 ， 因 为 主机 名 可 能 由 不 
. 定 长 的 字母 数字 组 成 ， 路 由 器 难以 处 理 。 由 于 这 些 原因 ， 主 机 也 可 以 使 用 所 谓 IP 地 址 
(IP address) 进行 标识 。 

我 们 将 在 第 4 章 更 为 详细 地 讨论 IP 地 址 ， 但 现在 简略 地 介绍 一 下 还 是 有 必要 的 。 一 
个 全 地 址 由 4 个 字 节 组 成 ,并 有 着 严格 的 层次 结构 。 例 如 121. 7. 106. 83 这 样 一 个 卫 地 
址 ， 其 中 的 每 个 字 节 都 被 句点 分 隔 开 来 ,表示 了 0 ~255 的 十 进 制 数字 。 我 们 说 IP 地 址 具 
有 层次 结构 ， 是 因为 当 我 们 从 左 至 右 扫 描 它 时 ， 我 们 会 得 到 越 来 越 具 体 的 关于 主机 位 于 因 
特 网 何 处 的 信息 ( 即 在 众多 网 络 的 哪个 网 络 里 ) 。 类 似 地 ， 当 我 们 从 下 向 上 查看 邮政 地 址 
时 ， 我 们 能 够 获得 该 地 址 位 于 何 处 的 越 来 越 具 体 的 信息 。 


2.4.1 DNS 提供 的 服务 


我 们 刚刚 看 到 了 识别 主机 有 两 种 方式 ， 通 过 主机 名 或 者 IP 地 址 。 人 们 喜欢 便于 记忆 
的 主机 名 标识 方式 ， 而 路 由 器 则 喜欢 定 长 的 、 有 着 层次 结构 的 卫 地 址 。 为 了 折 中 这 些 不 
同 的 偏好 ， 我 们 需要 一 种 能 进行 主机 名 到 IP 地 址 转换 的 目录 服务 。 这 就 是 域名 系统 
(Domain Name System, DNS) 的 主要 任务 。DNS 是 : 四 一 个 由 分 层 的 DNS 服务 器 (DNS 
server) 实现 的 分 布 式 数据 库 ; @ 一 个 使 得 主机 能 够 查询 分 布 式 数据 库 的 应 用 层 协 议 。 
DNS 服务 器 通常 是 运行 BIND ( Berkeley Internet Name Domain) 软件 [BIND 2012] 的 
UNIX 机 器 。DNS 协议 运行 在 UDP 之 上 ， 使 用 53 号 端口 。 
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DNS: 通过 客户 - 服务 器 模式 提供 的 重要 网 络 功能 


与 HTTP, FTP 和 SMTP 协议 一 样 ，DNS 协议 是 应 用 层 协 议 ， 其 原因 在 于 : OFA 
客户 -服务 器 模式 运行 在 通信 的 端 系统 之 间 ; 四 在 通信 的 端 系统 之 间 通 过 下 面 的 端 到 端 
运输 协议 来 传送 DNS 报 文 。 然 而 ， 在 其 他 意义 上 ，DNS 的 作用 非常 不 同 于 Web 应 用 、 
文件 传输 应 用 以 及 电子 邮件 应 用 。 与 这 些 应 用 程序 不 同 之 处 在 于 ，DNS 不 是 一 个 直接 和 
用 户 打 交道 的 应 用 。 相 反 ，DNS 是 为 因特网 上 的 用 户 应 用 程序 以 及 其 他 软件 提供 一 种 核 
心 功 能 ， 即 将 主机 名 转换 为 其 背后 的 卫 地址 。 我 们 在 1.2 节 就 提 到 ， 因 特 网 体系 结构 
的 复杂 性 大 多 数位 于 网 络 的 “边缘 ”。DNS 通过 采用 了 位 于 网 络 边缘 的 客户 和 服务 器 ， 
实现 了 关键 的 名 字 到 地 址 转换 功能 ， 它 还 是 这 种 设计 原理 的 另 一 个 范例 。 


















DNS 通常 是 由 其 他 应 用 层 协议 所 使 用 的 ， 包 括 HTTP, SMTP 和 ETP， 将 用 户 提供 的 主 
机 名 解析 为 IP 地 址 。 举 一 个 例子 ， 考 虑 运行 在 某 用 户主 机 上 的 一 个 浏览 器 〈 即 一 个 HTTP 
客户 ) 请 求 URL www. someschool. edu/index. html 页 面 时 会 发 生 什 么 现象 。 为 了 使 用 户 的 . 
主机 能 够 将 一 个 HTTP 请 求 报 文 发 送 到 Web 服务 器 www. someschool. edu， 该 用 户主 机 必须 
获得 www. someschool. edu 的 IP 地 址 。 其 做 法 如 下 。 
1) 同一 台 用 户主 机 上 运行 着 DNS 应 用 的 客户 端 。 
2) 浏览 器 从 上 述 URL 中 抽取 出 主机 名 www. someschool. edu， 并 将 这 人 台 主 机 名 传 给 
DNS 应 用 的 客户 端 。 
3) DNS 客户 向 DNS 服务 器 发 送 一 个 包含 主机 名 的 请 求 。 
4) DNS 客户 最 终 会 收 到 一 份 回答 报 文 ， 其 中 含有 对 应 于 该 主机 名 的 中 地址。 
5) 一 旦 浏览 器 接收 到 来 自 DNS 的 该 卫 地 址 ， 它 能 够 向 位 于 该 下 地址 80 端口 的 
HTTP 服务 器 进程 发 起 一 个 TCP 连接 。 
从 这 个 例子 中 ,我 们 可 以 看 到 DNS 给 使 用 它 的 因特网 应 用 带 来 了 额外 的 时 延 ， 有 时 
还 相当 可 观 。 幸 运 的 是 ， 如 我 们 下 面 讨论 的 那样 ， 想 获得 的 P 地 址 通常 就 缓存 在 一 个 
“附近 的 ”DNS 服务 器 中 ， 这 有 助 于 减少 DNS 的 网 络 流量 和 DNS 的 平均 时 延 。 
除了 进行 主机 名 到 IP 地 址 的 转换 外 ，DNS 还 提供 了 一 些 重要 的 服务 : 
© 主机 别名 (host aliasing) 。 有 着 复杂 主机 名 的 主机 能 拥有 一 个 或 者 多 个 别名 。 例 
如 ， 一 台 名 为 relay1. west- coast enterprise. com 的 主机 ， 可 能 还 有 两 个 别名 为 enter- 
prise. com 和 www. enterprise. com。 在 这 种 情况 下 ，relayl1. west- coast. enterprise. com 
也 称 为 规范 主机 名 (canonical hostname) 。 主 机 别名 ( 当 存 在 时 ) 比 主机 规范 名 更 
加 容易 记忆 。 应 用 程序 可 以 调用 DNS 来 获得 主机 别名 对 应 的 规范 主机 名 以 及 主机 
的 下 地 址 。 
© 邮件 服务 器 别名 (mail server aliasing) 。 显 而 易 见 ， 人 们 也 非常 希望 电子 邮件 地 址 
好 记忆 。 例 如 ， 如 果 Bob 在 雅虎 邮件 上 有 一 个 账户 ，Bob 的 邮件 地 址 就 像 bob@ ya- 
hoo. com 这 样 简单 。 然 而 ,雅虎 邮件 服务 器 的 主机 名 可 能 更 为 复杂 ， 不 像 ya- 
hoo. com 那样 简单 好 记 (例如 ， 规 范 主机 名 可 能 像 relayl. west- coast. hotmail. com 
那样 )。 电 子 邮 件 应 用 程序 可 以 调用 DNS， 对 提供 的 主机 名 别名 进行 解析 ， 以 获得 
该 主机 的 规范 主机 名 及 其 I 了 PP 地址。 事实 上 ，MX 记录 (参见 后 面 ) 允许 一 个 公司 
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的 邮件 服务 器 和 Web 服务 器 使 用 相同 (别名 化 的 ) 的 主机 名 ; 例如， 一 个 公司 的 
Web 服务 器 和 邮件 服务 器 都 能 叫 作 enterprise. com。 
© RAH (load distribution), DNS 也 用 于 在 元 余 的 服务 器 (UNITARY Web 服务 器 
等 ) 之 间 进 行 负载 分 配 。 繁 忙 的 站 点 (如 cenn. com) 被 元 余 分 布 在 多 台 服 务 器 上 ， 
每 台 服 务 器 均 运 行 在 不 同 的 端 系统 上 ， 每 个 都 有 着 不 同 的 卫 地 址 。 由 于 这 些 元 余 
的 Web 服务 器 ， 一 个 卫 地 址 集合 因此 与 同一 个 规范 主机 名 相 联 系 。DNS 数据 库 中 
存储 着 这 些 P 地 址 集合 。 当 客户 对 映射 到 某 地 址 集合 的 名 字 发 出 一 个 DNS 请 求 
时 ,该 服务 器 用 IP 地 址 的 整个 集合 进行 响应 ， 但 在 每 个 回答 中 循环 这 些 地 址 次 
序 。 因 为 客户 通常 总 是 向 IP 地 址 排 在 最 前 面 的 服务 器 发 送 HTTP 请 求 报 文 ， 所 以 
DNS 就 在 所 有 这 些 元 余 的 Web 服务 器 之 间 循 环 分 配 了 负载 。DNS 的 循环 同样 可 以 
用 于 邮件 服务 器 ， 因 此 ， 多 个 邮件 服务 器 可 以 具有 相同 的 别名 。 一 些 内 容 分 发 公 
司 如 Akamai 也 以 更 加 复杂 的 方式 使 用 DNS [ Dilley 2002] ， 以 提供 Web 内 容 分 发 
(参见 2.6.3 节 )。 
DNS 由 RFC 1034 和 RFC 1035 定义 ， 并 且 在 几 个 附加 的 RFC 中 进行 了 更 新 。DNS 是 
一 个 复杂 的 系统 ， 我 们 在 这 里 只 是 就 其 运行 的 主要 方面 进行 学 习 。 感 兴趣 的 读者 可 以 参考 
这 些 RFC 文档 和 Albitz 和 Liu 写 的 书 [Albitz 1993]; 亦 可 参阅 文章 [ Mockapetris 1998 ] 
和 [Mockapetris 2005 ] ， 其 中 [ Mockapetris 1998] 是 回顾 性 的 文章 ， 它 提供 了 DNS 组 成 和 
工作 原理 的 精细 的 描述 。 


2.4.2 DNS 工作 机 理 概 述 


下 面 给 出 一 个 DNS 工作 过 程 的 总 体 概括 ， 我 们 的 讨论 将 集中 在 主机 名 到 IP 地 址 转换 
服务 方面 。 

假设 运行 在 用 户主 机 上 的 某 些 应 用 程序 (如 Web 浏览 器 或 邮件 阅读 器 ) 需要 将 主 
机 名 转换 为 卫 地 址 。 这 些 应 用 程序 将 调用 DNS 的 客户 端 ， 并 指明 需要 被 转换 的 主机 名 
(在 很 多 基于 UNIX 的 机 器 上 ， 应 用 程序 为 了 执行 这 种 转换 需要 调用 函数 gethostbyname() ) 。 
用 户主 机 上 的 DNS 接收 到 后 ， 向 网 络 中 发 送 一 个 DNS 查询 报 文 。 所 有 的 DNS 请 求 和 
回答 报 文 使 用 UDP 数据 报 经 端口 53 发 送 。 经 过 若干 毫秒 到 若干 秒 的 时 延 后 ， 用 户主 
机 上 的 DNS 接收 到 一 个 提供 所 希望 映射 的 DNS 回答 报 文 。 这 个 映射 结果 则 被 传递 到 
调用 DNS 的 应 用 程序 。 因 此 ， 从 用 户主 机 上 调用 应 用 程序 的 角度 看 ，DNS 是 一 个 提 
供 简单 、 直 接 的 转换 服务 的 黑 盒 子 。 但 事实 上 ， 实 现 这 个 服务 的 黑 盒 子 非 常 复杂 ， 它 
由 分 布 于 全 球 的 大 量 DNS 服务 器 以 及 定义 了 DNS 服务 器 与 查询 主机 通信 方式 的 应 用 
层 协议 组 成 。 

DNS 的 一 种 简单 设计 是 在 因特网 上 只 使 用 一 个 DNS 服务 器 ， 该 服务 器 包含 所 有 的 映 
射 。 在 这 种 集中 式 设计 中 ， 客 户 直接 将 所 有 查询 直接 发 往 单 一 的 DNS 服务 器 ， 同 时 该 
DNS 服务 器 直接 对 所 有 的 查询 客户 做 出 响应 。 尽 管 这 种 设计 的 简单 性 非常 具有 吸引 力 , 但 
它 不 适用 于 当今 的 因特网 ， 因 为 因特网 有 着 数量 巨大 (并 持续 增长 ) 的 主机 。 这 种 集中 式 
设计 的 问题 包括 : 

e 单 点 故障 (a single point of failure)。 如 果 该 DNS 服务 器 月 演 ， 整 个 因特网 随 之 

HEHE! 
。 通信 容量 (traffic volume) 。 单 个 DNS 服务 器 不 得 不 处 理 所 有 的 DNS 查询 (用 于 为 
上 亿 台 主机 产生 的 所 有 HTTP 请 求 报 文 和 电子 邮件 报 文 服务 ) 。 
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© 远 距 离 的 集中 式 数据 库 (distant centralized database), 94> DNS 服务 器 不 可 能 
“邻近 ”所 有 查询 客户 。 如 果 我 们 将 单 台 DNS 服务 器 放 在 纽约 市 ， 那 么 所 有 来 自 
澳大利亚 的 查询 必须 传播 到 地 球 的 另 一 边 ， 中 间 也 许 还 要 经 过 低速 和 拥塞 的 链 路 。 
这 将 导致 严重 的 时 延 。 

© 维护 (maintenance)。 单 个 DNS 服务 器 将 不 得 不 为 所 有 的 因特网 主机 保留 记录 。 
这 不 仅 将 使 这 个 中 央 数 据 库 庞大 ， 而 且 它 还 不 得 不 为 解决 每 个 新 添加 的 主机 而 频 
繁 更 新 。 

总 的 来 说 ， 在 单一 DNS 服务 器 上 运行 集中 式 数据 库 完 全 没有 可 扩展 能 力 。 因 此 ，DNS 
采用 了 分 布 式 的 设计 方案 。 事 实 上 ，DNS 是 一 个 在 因特网 上 实现 分 布 式 数 据 库 的 精彩 
范例 。 

1. 分 布 式 、 层 次 数据 库 


为 了 处 理 扩 展 性 问题 ，DNS 使 用 了 大 量 的 DNS 服务 器 ， 它 们 以 层次 方式 组 织 ， 并 
且 分 布 在 全 世界 范围 内 。 没 有 一 台 DNS 服务 器 拥有 因特网 上 所 有 主机 的 上 映射。 相反， 
这 些 映射 分 布 在 所 有 的 DNS 服务 器 上 。 大 致 说 来 ， 有 3 种 类 型 的 DNS 服务 器 : 根 DNS 
服务 器 、 顶 级 域 (Top-Level Domain, TLD) DNS 服务 器 和 权威 DNS 服务 器 。 这 些 服务 
器 以 图 2-17 中 所 示 的 层次 结构 组 织 起 来 。 为 了 理解 这 3 种 类 型 的 DNS 服务 器 交互 的 方 
A, 假定 一 个 DNS 客户 要 决定 主机 名 www. amazon. com 的 IP 地址 。 粗 上 略 说 来 ， 将 发 生 
下 列 事件 。 客 户 首先 与 根 服务 器 之 一 联系 ， 它 将 返回 顶级 域名 com 的 TLD 服务 器 的 人 P 
地 址 。 该 客户 则 与 这 些 TLD 服务 器 之 一 联系 ， 它 将 为 amazon. com 返回 权威 服务 器 的 IP 
地 址 。 最 后 ， 该 客户 与 amazon. com 权威 服务 器 之 一 联系 ， 它 为 主机 名 www. amazon. com 
返回 其 IP 地 址 。 我 们 将 很 快 更 为 详细 地 考察 DNS 查找 过 程 。 不 过 我 们 先 仔细 看 一 下 这 
3 种 类 型 的 DNS 服务 器 。 





图 2-17 部 分 DNS 服务 器 的 层次 结构 

e 根 DNS 服务 器 。 有 400 多 个 根 名 字 服 务 器 遍及 全 世界 。 这 些 根 名 字 服 务 器 由 13 
个 不 同 的 组 织 管 理 。 根 名 字 服 务 器 的 全 部 清单 连同 管理 它们 的 组 织 及 其 P 地 址 可 
LIE [Root Servers 2016] 中 找到 。 根 名 字 服 务 器 提供 TLD 服务 器 的 IP 地 址 。 

。 顶级 域 (DNS) 服务 器 。 对 于 每 个 顶级 域 (如 com, org, net, edu 和 gov) 和 所 有 
国家 的 顶级 域 (Auk, fr, ca Al jp), ABA TLD 服务 器 (或 服务 器 集群 )。Verisign 
Global Registry Services 公司 维护 com 顶级 域 的 TLD 服务 器 ，Educause 公司 维护 edu 
顶级 域 的 TLD 服务 器 。 支 持 TLD 的 网 络 基 础 设施 可 能 是 大 而 复杂 的 ，[ Osterweil 
2012] 对 Verisign 网 络 进行 了 很 好 的 概述 。 所 有 顶级 域 的 列表 参见 [TLD list 
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2016] > TLD 服务 器 提供 了 权威 DNS 服务 器 的 IP 地 址 。 

。 权威 DNS 服务 器 。 在 因特网 上 具有 公共 可 访问 主机 (如 Web 服务 器 和 邮件 服务 
air) 的 每 个 组 织 机 构 必 须 提供 公共 可 访问 的 DNS 记录 ， 这 些 记 录 将 这 些 主 机 的 名 
字 映 射 为 地址 。 一 个 组 织 机 构 的 权威 DNS 服务 器 收藏 了 这 些 DNS 记录 。 一 个 
组 织 机 构 能 够 选择 实现 它 自 己 的 权威 DNS 服务 器 以 保存 这 些 记录 ; 另 一 种 方法 
是 ， 该 组 织 能 够 支付 费用 ， 让 这 些 记录 存储 在 某 个 服务 提供 商 的 一 个 权威 DNS 服 
务 器 中 。 多 数 大 学 和 大 公司 实现 和 维护 它们 自己 基本 和 辅助 (备份 ) 的 权威 DNS 


服务 器 。 


根 、TLD 和 权威 DNS 服务 器 都 处 在 该 DNS 服务 器 的 层次 结构 中 ， 如 图 2-17 所 示 。 还 
有 另 一 类 重要 的 DNS 服务 器 ， 称 为 本 地 DNS 服务 器 (local DNS server) 。 严 格 说 来 ， 一 个 
本 地 DNS 服务 器 并 不 属于 该 服务 器 的 层次 结构 ,但 它 对 DNS 层次 结构 是 至 关 重 要 的 。 每 
个 ISP (如 一 个 居民 区 的 ISP 或 一 个 机 构 的 ISP) 都 有 一 台 本 地 DNS 服务 器 (也 叫 默 认 名 
字 服 务 器 ) 。 当 主机 与 某 个 ISP 连接 时 ， 该 ISP 提供 一 台 主 机 的 IP 地 址 ,该 主机 具有 一 台 
或 多 台 其 本 地 DNS 服务 器 的 IP 地 址 (通常 通过 DHCP, 将 在 第 4 章 中 讨论 )。 通 过 访问 
Windows 或 UNIX 的 网 络 状态 窗口 ， 用 户 能 够 容易 地 确定 他 的 本 地 DNS 服务 器 的 IP 地 址 。 


主机 的 本 地 DNS 服务 器 通常 “邻近 ”本 主 
机 。 对 某 机 构 ISP 而 言 ， 本 地 DNS 服务 器 
可 能 就 与 主机 在 同一 个 局 域 网 中 ; 对 于 某 
居民 区 ISP 来 说 ， 本 地 DNS 服务 器 通常 与 
主机 相隔 不 超过 几 台 路 由 器 。 当 主机 发 出 
DNS 请 求 时 ， 该 请 求 被 发 往 本 地 DNS 服务 
器 ， 它 起 着 代理 的 作用 ， 并 将 该 请 求 转发 
到 DNS 服务 器 层次 结构 中 ， 我 们 下 面 将 更 
为 详细 地 讨论 。 

我 们 来 看 一 个 简单 的 例子 ， 假 设 主 机 
cse. nyu. edu 想 知 道 主机 gaia. cs. umass. edu 
A IP bhis RIAA AK (NYU) 的 
cse. nyu. edu 主机 的 本 地 DNS 服务 器 为 
dns. nyu. edu， 并 且 gaia. cs. umass. edu 的 权 
威 DNS 服务 器 为 dns. umass. edu。 如 图 2-18 
所 示 ， 主 枯 cse. nyu. edu 首先 向 它 的 本 地 
DNS 服务 器 dns. nyu. edu 发 送 一 个 DNS #4 
询 报 文 。 该 查询 报 文 含有 被 转换 的 主机 名 
gaia. cs. umass. edu, AX Hh DNS 服务 器 将 该 
报 文 转发 到 根 DNS 服务 器 。 该 根 DNS 服务 
器 注意 到 其 edu 前 级 并 向 本 地 DNS 服务 器 
返回 负责 edu 的 TLD 的 IP 地 址 列表 。 该 本 


根 DNS 服 务 器 


外 


本 地 DNS 服 务 器 


dns.nyu.edu 


T 


TLD DNS 服务 器 


| 


请 求 主机 


cse.nyu.edu 


权威 DNS 服务 器 


dns.umass.edu 


gaia.cs.umass.edu 


2-18 各 种 DNS 服务 器 的 交互 


地 DNS 服务 器 则 再 次 向 这 些 TLD 服务 器 之 一 发 送 查 询 报 文 。 该 TLD 服务 器 注意 到 
umass. edu 前 级 ， 并 用 权威 DNS 服务 器 的 IP 地 址 进行 响应 ， 该 权威 DNS 服务 器 是 负责 马 
萨 诸 塞 大 学 的 dns. umass. edu。 最 后 ， 本 地 DNS 服务 器 直接 向 dns. umass. edu 重 发 查询 报 
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文 ，dns. umass. edu 用 gaia. cs. umass. edu 的 IP 地 址 进行 响应 。 注 意 到 在 本 例 中 ， 为 了 获得 
一 台 主 机 名 的 映射 ， 共 发 送 了 8 份 DNS 报 文 : 4 份 查询 报 文 和 4 份 回答 报 文 ! 我 们 将 很 快 
明白 利用 DNS 缓存 减少 这 种 查询 流量 的 方法 。 

我 们 前 面 的 例子 假设 了 TLD 服务 器 知道 用 于 主机 的 权威 DNS 服务 器 的 卫 地 址 。 一 般 
而 言 ， 这 种 假设 并 不 总 是 正确 的 。 相 反 ，TLD 服务 器 只 是 知道 中 间 的 某 个 DNS 服务 器 ， 
该 中 间 DNS 服务 器 依次 才能 知道 用 于 该 主机 的 权威 DNS 服务 器 。 例 如 ， 再 次 假设 马 萨 诸 
塞 大 学 有 一 台 用 于 本 大 学 的 DNS 服务 器 ， 它 称 为 dns. umass. edu。 同 时 假设 该 大 学 的 每 个 
系 都 有 自己 的 DNS 服务 器 ， 每 个 系 的 DNS 服务 器 是 本 系 所 有 主机 的 权威 服务 器 。 在 这 种 
情况 下 ， 当 中 间 DNS 服务 器 dns. umass. edu 收 到 了 对 某 主机 的 请 求 时 ， 该 主机 名 是 以 
cs. umass. edu 结尾 ， 它 向 dns. nyu. edu 返回 dns. cs. umass. edu 的 IP 地 址 ， 后 者 是 所 有 以 
cs. umass. edu 结尾 的 主机 的 权威 服务 器 。 本 地 DNS 服务 器 dns. nyu. edu 则 向 权威 DNS 服务 
器 发 送 查 询 ， 该 权威 DNS 服务 器 向 本 地 DNS 服务 器 返回 所 希望 的 映射 ， 该 本 地 服务 器 依 
次 向 请 求 主 机 返回 该 映射 。 在 这 个 例子 中 ， 共 发 送 了 10 份 DNS 报 文 ! 

图 2-18 所 示 的 例子 利用 了 递归 查询 (recursive query) 和 和 迭代 查询 (iterative query) 。 
从 cse. nyu. edu 到 dns. nyu. edu 发 出 的 查询 是 递归 查询 ， 因 为 该 查询 以 自己 的 名 义 请 求 
dns. nyu. edu 来 获得 该 映射 。 而 后 继 的 3 个 查询 是 迭代 查询 ， 因 为 所 有 的 回答 都 是 直接 返 
回 给 dns. nyu. edu。 从 理论 上 讲 ， 任 何 DNS 根 DNS 服 务 器 
查询 既 可 以 是 迭代 的 也 能 是 递归 的 。 例 如 ， 

2-19 显示 了 一 条 DNS 查询 链 ， 其 中 的 所 

有 查询 都 是 递归 的 。 实 践 中 ， 查 询 通常 遵 op 

MER 2-18 中 的 模式 : 从 请 求 主 机 到 本 地 ee 

DNS 服务 器 的 查询 是 递归 的 ， 其 余 的 查询 ` 

是 迭代 的 。 E 

2. DNS 缓存 | | 

至 此 我 们 的 讨论 一 直 忽略 了 DNS 系统 “本 地 DNS 服务 器 
的 一 个 非常 重要 特色 : DNS 缓存 (DNS 9ans.nyv.edv 
caching) 。 实 际 上 ， 为 了 改善 时 延性 能 并 减 
少 在 因特网 上 到 处 传输 的 DNS 报 文 数量 ， 

DNS 广泛 使 用 了 缓存 技术 。DNS 缓存 的 原 
理 非常 简单 。 在 一 个 请 求 链 中 ， 当 某 DNS 
服务 器 接收 一 个 DNS 回答 (例如 ， 包 含 某 E 





主机 名 到 IP 地址 的 映射 ) 时 ， 它 能 将 映射 = 
缓存 在 本 地 存储 器 中 。 例 如 ， 在 图 2- 18 

中 ， 每 当 本 地 DNS 服务 器 dns. nyu. edu 从 ea 
某 个 DNS 服务 器 接收 到 一 个 回答 ， 它 能 够 

缓存 包含 在 该 回答 中 的 任何 信息 。 如 果 在 

DNS 服务 器 中 缓存 了 一 台 主 机 名 /下 地 址 gaia.cs.umass.edu 
对 ,， 另 一 个 对 相同 主机 名 的 查询 到 达 访 ed nite toate 

DNS 服务 器 时 ， 该 DNS 服务 器 就 能 够 提供 

所 要 求 的 了 正 地 址 ， 即 使 它 不 是 该 主机 名 的 权威 服务 器 。 由 于 主机 和 主机 名 与 IP 地 址 间 的 


权威 DNS 服务 器 
请 求 主 机 dns.umass.edu 
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映射 并 不 是 永久 的 ，DNS 服务 器 在 一 段 时 间 后 (通常 设置 为 两 天 ) 将 丢弃 缓存 的 信息 。 

举 一 个 例子 ， 假 定 主机 apricot. nyu. edu [Aj dns. nyu. edu 查询 主机 名 cnn. com 的 IP 地 址 。 
此 后 ， 假 定 过 了 几 个 小 时 ， 纽 约 大 学 的 另外 一 台 主 机 如 kiwi. nyu. edu 也 向 dns. nyu. edu 查询 
相同 的 主机 名 。 因 为 有 了 缓存 ， 该 本 地 DNS 服务 器 可 以 立即 返回 cnn. com 的 IP 地 址 ， 而 不 
必 查 询 任何 其 他 DNS 服务 器 。 本 地 DNS 服务 器 也 能 够 缓存 TLD 服务 器 的 IP 地 址 ， 因 而 多 
许 本 地 DNS 绕 过 查询 链 中 的 根 DNS 服务 器 。 事 实 上 ， 因 为 缓存 ， 除 了 少数 DNS 查询 以 
外 ， 根 服务 器 被 绕 过 了 。 


2.4.3 DNS 记录 和 报 文 


共同 实现 DNS 分 布 式 数据 库 的 所 有 DNS 服务 器 存储 了 资源 记录 (Resource Record, 
RR), RR 提供 了 主机 名 到 IP 地 址 的 映射 。 每 个 DNS 回答 报 文 包含 了 一 条 或 多 条 资源 记 
录 。 在 本 小 节 以 及 后 续 小 节 中 ,我 们 概要 地 介绍 DNS 资源 记录 和 报 文 ， 更 详细 的 信息 可 
以 在 [ Albitz 1993] 或 有 关 DNS 的 RFC 文档 [RFC 1034; RFC 1035] 中 找到 。 
资源 记录 是 一 个 包含 了 下 列 字段 的 4 元 组 : 


(Name, Value, Type, TTL) 


TTL 是 该 记录 的 生存 时 间 ， 它 决定 了 资源 记录 应 当 从 缓存 中 删除 的 时 间 。 在 下 面 给 出 
的 记录 例子 中 ， 我 们 忽略 掉 TTL 字段 。Name 和 Value 的 值 取决 于 Type: 
e 如 果 Type =A， 则 Name 是 主机 各 ，Value 是 该 主机 名 对 应 的 IP 地 址 。 因 此 ， 一 条 
类 型 为 A 的 资源 记录 提供 了 标准 的 主机 名 到 IP 地 址 的 映射 。 例 如 (relayl. 
bar. foo. com, 145. 37. 93. 126, A) 就 是 一 条 类 型 A 记录 。 
e 如 果 Type =NS， 则 Name 是 个 域 (如 foo. com), mi Value 是 个 知道 如 何 获得 该 域 
中 主机 IP 地 址 的 权威 DNS 服务 器 的 主机 名 。 这 个 记录 用 于 沿 着 查询 链 来 路 由 DNS 
查询 。 例 如 (foo. com, dns. foo. com, NS) 就 是 一 条 类 型 为 NS 的 记录 。 
e 如 果 Type =CNAME， 则 Value 是 别名 为 Name 的 主机 对 应 的 规范 主机 名 。 该 记录 
能 够 向 查询 的 主机 提供 一 个 主机 名 对 应 的 规范 主机 名 ， 例 如 (foo. com，relayl. 
bar. foo. com, CNAME) 就 是 一 条 CNAME 类 型 的 记录 。 
e 如 果 Type =MX， 则 Value 是 个 别名 为 Name 的 邮件 服务 器 的 规范 主机 名 。 举 例 来 
Wi, (foo. com, mail. bar. foo. com, MX) 就 是 一 条 MX 记录 。MX 记录 人 允许 邮件 服 
务 器 主机 名 具有 简单 的 别名 。 值 得 注意 的 是 ， 通 过 使 用 MX 记录 ， 一 个 公司 的 邮 
件 服务 器 和 其 他 服务 器 (如 它 的 Web 服务 器 ) 可 以 使 用 相同 的 别名 。 为 了 获得 邮 
件 服务 器 的 规范 主机 名 ，DNS 客户 应 当 请 求 一 条 MX 记录 ; 而 为 了 获得 其 他 服务 
器 的 规范 主机 名 ，DNS 客户 应 当 请 求 CNAME 记录 。 
如 果 一 台 DNS 服务 器 是 用 于 某 特定 主机 名 的 权威 DNS 服务 器 ， 那 么 该 DNS 服务 器 会 
有 一 条 包含 用 于 该 主机 名 的 类 型 A 记录 (即使 该 DNS 服务 器 不 是 其 权威 DNS 服务 器 ， 它 
也 可 能 在 缓存 中 包含 有 一 条 类 型 A 记录 ) 。 如 果 服 务 器 不 是 用 于 某 主机 名 的 权威 服务 器 ， 
那么 该 服务 器 将 包含 一 条 类 型 NS 记录 ， 该 记录 对 应 于 包含 主机 名 的 域 ; 它 还 将 包括 一 条 
类 型 A 记录 ， 该 记录 提供 了 在 NS 记录 的 Value 字段 中 的 DNS 服务 器 的 IP 地 址 。 举 例 来 
说 ,假设 一 台 edu TLD 服务 器 不 是 主机 gaia. cs. umass. edu 的 权威 DNS 服务 器 ， 则 该 服务 
器 将 包含 一 条 包括 主机 cs. umass. edu 的 域 记 录 ， 如 (umass. edu, dns. umass. edu, NS); 
该 edu TLD 服务 器 还 将 包含 一 条 类 型 A 记录 ， 如 (dns. umass. edu, 128.119.40.111, A), 





该 记录 将 名 字 dns. umass. edu 映射 为 一 个 IP 地 址 。 
1. DNS 报 文 


在 本 节 前 面 ， 我 们 提 到 了 DNS 查询 和 回答 报 文 。DNS 只 有 这 两 种 报 文 ， 并 且 ， 碍 询 
和 回答 报 文 有 着 相同 的 格式 ， 如 图 2-20 所 示 。DNS 报 文中 各 字段 的 语义 如 下 : 


j 字 节 


| [ese 
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Al 2-20 DNS 报 文 格式 


前 12 个 字 节 是 首部 区 域 ， 其 中 有 几 个 字段 。 第 一 个 字段 (标识 符 ) 是 一 个 16 比 
特 的 数 ， 用 于 标识 该 查询 。 这 个 标识 符 会 被 复制 到 对 查询 的 回答 报 文 中 ， 以 便 让 
客户 用 它 来 匹配 发 送 的 请 求 和 接收 到 的 回答 。 标 志 字 段 中 含有 若干 标志 。!1 比特 
的 “查询 /回答 ” 标志 位 指出 报 文 是 查询 报 文 (0) 还 是 回答 报 文 (1)。 当 某 DNS 
服务 器 是 所 请 求 名 字 的 权威 DNS 服务 器 时 ，1 比特 的 “权威 的 ”标志 位 被 置 在 回 
答 报 文中 。 如 果 客 户 (主机 或 者 DNS 服务 器 ) 在 该 DNS 服务 器 没有 某 记录 时 希望 
它 执行 递归 查询 ， 将 设置 1 比特 的 “希望 递归 ”标志 位 。 如 果 该 DNS 服务 器 支持 
递归 查询 ， 在 它 的 回答 报 文中 会 对 1 比特 的 “递归 可 用 ”标志 位 置 位 。 在 该 首部 
H, 还 有 4 个 有 关 数 量 的 字段 ,这些 字段 指出 了 在 首部 后 的 4 类 数据 区 域 出 现 的 
数量 。 

问题 区 域 包 含 着 正在 进行 的 查询 信息 。 该 区 域 包 括 : 名 字 字 段 ， 包 含 正 在 被 查询 
的 主机 名 字 ; @@ 类 型 字段 ， 指 出 有 关 该 名 字 的 正 被 询问 的 问题 类 型 ， 例 如 主机 地 址 
是 与 一 个 名 字 相 关联 (类 型 A) 还 是 与 某 个 名 字 的 邮件 服务 器 相关 联 (类 型 MX)。 
在 来 自 DNS 服务 器 的 回答 中 ， 回 答 区 域 包含 了 对 最 初 请 求 的 名 字 的 资源 记录 。 前 
面 讲 过 每 个 资源 记录 中 有 Type (W A, NS, CNAME 和 MX) Be, Value 字段 和 
TTL 字段 。 在 回答 报 文 的 回答 区 域 中 可 以 包含 多 条 RR， 因 此 一 个 主机 名 能 够 有 多 
个 卫 地 址 〈 例 如 ， 就 像 本 节 前 面 讨 论 的 元 余 Web 服务 器 ) o 

权威 区 域 包含 了 其 他 权威 服务 器 的 记录 。 

附加 区 域 包含 了 其 他 有 帮助 的 记录 。 例 如 ， 对 于 一 个 MX 请 求 的 回答 报 文 的 回答 
区 域 包含 了 一 条 资源 记录 ， 该 记录 提供 了 邮件 服务 器 的 规范 主机 名 。 该 附加 区 域 
包含 一 个 类 型 A 记录 ,该 记录 提供 了 用 于 该 邮件 服务 器 的 规范 主机 名 的 中 地 址 。 


你 愿意 从 正在 工作 的 主机 直接 向 某 些 DNS 服务 器 发 送 一 个 DNS 查询 报 文 吗 ? 使 用 
nslookup 程序 (nslookup program) 能 够 容易 地 做 到 这 一 点 ， 这 对 于 多 数 Windows 和 UNIX 平 
台 ，nslookup 程序 是 可 用 的 。 例 如 ， 从 一 台 Windows 主机 打开 命令 提示 符 界面 ， 直 接 键 人 
“nslookup” 即 可 调用 该 nslookup 程序 。 在 调用 nslookup 后 ， 你 能 够 向 任何 DNS 服务 器 








( 根 、TLD 或 权威 ) 发 送 DNS 查询 。 在 接收 到 来 自 DNS 服务 器 的 回答 后 ，nslookup 将 显示 
包括 在 该 回答 中 的 记录 (以 人 可 读 的 格式 )。 从 你 自己 的 主机 运行 nslookup 还 有 一 种 方法 ， 
即 访问 允许 你 远程 应 用 nslookup 的 许多 Web 站 点 之 一 (在 一 个 搜索 引擎 中 键入 
“nslookup” 就 能 够 得 到 这 些 站 点 中 的 一 个 ) 。 本 章 最 后 的 DNS Wireshark 实验 将 使 你 更 为 
详细 地 研究 DNS, 

2. 在 DNS 数据 库 中 插入 记录 


上 面 的 讨论 只 是 关注 如 何 从 DNS 数据 库 中 取 数 据 。 你 可 能 想 知道 这 些 数 据 最 初 是 怎 
么 进入 数据 库 中 的 。 我 们 在 一 个 特定 的 例子 中 看 看 这 是 如 何 完成 的 。 假 定 你 刚刚 创建 一 个 
称 为 网 络 乌托邦 (Network Utopia) 的 令 人 兴奋 的 新 创业 公司 。 你 必定 要 做 的 第 一 件 事 是 
在 注册 登记 机 构 注 册 域 名 networkutopia. com。 注 册 登 记 机 构 (registrar) 是 一 个 商业 实体 ， 
它 验 证 该 域名 的 唯一 性 ， 将 该 域名 输入 DNS 数据 库 (如 下 面 所 讨论 的 那样 )， 对 提供 的 服 
务 收取 少量 费用 。1999 年 前 ， 唯 一 的 注册 登记 机 构 是 Nework Solution， 它 独家 经 营 对 于 
com, net 和 org 域名 的 注册 。 但 是 现在 有 许多 注册 登记 机 构 竞 争 客户 ， 因 特 网 名 字 和 地 址 
分 配 机 构 (Internet Corporation for Assigned Names and Numbers, ICANN) 向 各 种 注册 登记 
机 构 授权 。 在 http://www. internic. net 上 可 以 找到 授权 的 注册 登记 机 构 的 列表 。 

当 你 向 某 些 注册 登记 机 构 注册 域名 networkutopia. com 时 ， 需 要 向 该 机 构 提 供 你 的 基本 
和 辅助 权威 DNS 服务 器 的 名 字 和 卫 地 址 。 假 定 该 名 字 和 IP 地 址 是 dnsl. networkutopia. com 
和 dns2. networkutopia. com 及 212. 212. 212. 1 和 212. 212. 212. 2。 对 这 两 个 权威 DNS 服务 器 
的 每 一 个 ， 该 注册 登记 机 构 确 保 将 一 个 类 型 NS 和 一 个 类 型 A 的 记录 输入 TLD com 服务 
器 。 特 别 是 对 于 用 于 networkutopia. com 的 基本 权威 服务 器 ， 该 注册 登记 机 构 将 下 列 两 条 资 
源 记录 插入 该 DNS 系统 中 : 


(networkutopia.com, dnsl.networkutopia.com, NS) 
(dnsl.networkutopia.com, 212.212.212.1, A) 


你 还 必须 确保 用 于 Web 服务 器 www. networkutopia. com 的 类 型 A 资源 记录 和 用 于 邮件 
服务 器 mail. networkutopia. com 的 类 型 MX 资源 记录 被 输入 你 的 权威 DNS 服务 器 中 。( 直 到 
最 近 ， 每 台 DNS 服务 器 中 的 内 容 都 是 静态 配置 的 ， 例 如 来 自 系统 管理 员 创建 的 配置 文件 。 
最 近 ， 在 DNS 协议 中 添加 了 一 个 更 新 (UPDATE) 选项 ， 人 允许 通过 DNS 报 文 对 数据 库 中 
的 内 容 进 行动 态 添加 或 者 删除 。[ RFC 2136] 和 [RFC 3007] 定义 了 DNS 动态 更 新 。) 

一 且 完 成 所 有 这 些 步 又 ， 人 们 将 能 够 访问 你 的 Web 站 点 ， 并 向 你 公司 的 雇员 发 送 电 
子 邮件 = 我 们 通过 验证 该 说 法 的 正确 性 来 总 结 DNS 的 讨论 。 这 种 验证 也 有 助 于 充实 我 们 
已 经 学 到 的 DNS 知识 。 假 定 在 澳大利亚 的 Alice 要 观看 www. networkutopia. com 的 Web 页 
面 。 如 前 面 所 讨论 ， 她 的 主机 将 首先 向 其 本 地 DNS 服务 器 发 送 请 求 。 该 本 地 服务 器 接着 
则 联系 一 个 TLD com 服务 器 。( 如 果 TLD com 服务 器 的 地 址 没有 被 缓存 ， 该 本 地 DNS 服务 
器 也 将 必须 与 根 DNS 服务 器 相 联 系 。) 该 TLD 服务 器 包含 前 面 列 出 的 类 型 NS 和 类 型 A 资 
源 记录 ， 因 为 注册 登记 机 构 将 这 些 资源 记录 插入 所 有 的 TLD com 服务 器 。 该 TLD com 服务 
器 向 Alice 的 本 地 DNS 服务 器 发 送 一 个 回答 ， 该 回答 包含 了 这 两 条 资源 记录 。 该 本 地 DNS 
服务 器 则 向 212. 212. 212. 1 发 送 一 个 DNS 查询 ， 请 求 对 应 于 www. networkutopia. com 的 类 
型 A 记录 。 该 记录 提供 了 所 希望 的 Web 服务 器 的 下 地 址 ， 如 212.212.71.4， 本 地 DNS 服 
务 器 将 该 地 址 回 传 给 Alice 的 主机 。Alice 的 浏览 器 此 时 能 够 向 主机 212. 212. 71. 4 发 起 一 个 
TCP 连接 ， 并 在 该 连接 上 发 送 一 个 HTTP 请 求 。 当 一 个 人 在 网 上 冲浪 时 ， 有 比 满足 眼球 更 
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多 的 事情 在 进行 ! 


SR 


DNS 脆弱 性 


我 们 已 经 看 到 DNS 是 因特网 基础 设施 的 一 个 至 关 重 要 的 组 件 ， 对 于 包括 Web、 电 | 
子 邮 件 等 的 许多 重要 的 服务 ,没有 它 都 不 能 正常 工作 。 因 此 ,我 们 自然 要 问 ，DNS 怎么 
能 够 被 攻击 呢 ? DNS 是 一 个 易 受 攻击 的 目标 吗 ? 它 是 将 会 被 淘汰 的 服务 吗 ? 大 多 数 因 特 | 
网 应 用 会 随同 它 一 起 无 法 工作 吗 ? | 

想到 的 第 一 种 针对 DNS 服务 的 攻击 是 分 布 式 拒绝 服务 (DDoS) 带宽 洪 泛 攻 击 (A 
见 1.6 节 )。 例 如 ， 某 攻击 者 能 够 试图 向 每 个 DNS 根 服务 器 发 送 大 量 的 分 组 ， 使 得 大 多 
数 合法 DNS 请 求 得 不 到 回答 。 这 种 对 DNS 根 服务 器 的 DDoS 大 规模 攻击 实际 发 生 在 | 
2002 #10 月 21 日。 在 这 次 攻击 中 ， 该 攻击 者 利用 一 个 僵尸 网 络 向 13 个 DNS 根 服务 器 
中 的 每 个 都 发 送 了 大 批 的 ICMP ping 报 文 负载 。 (5.6 节 中 讨论 了 ICMP 报 文 。 此 时 ， 知 
道 ICMP 分 组 是 特殊 类 型 的 IP 数据 报 就 可 以 了 。) 幸运 的 是 ， 这 种 大 规模 攻击 所 带 来 的 | 
损害 很 小 ， 对 用 户 的 因特网 体验 几乎 没有 或 根本 没有 影响 。 攻 击 者 的 确 成 功 地 将 大 量 的 - 
分 组 指向 了 根 服 务 器 ， 但 许多 DNS 根 服务 器 受到 了 分 组 过 滤器 的 保护 ， 配 置 的 分 组 过 
滤器 阻挡 了 所 有 指向 根 服务 器 的 ICMP ping 报 文 。 这 些 被 保护 的 服务 器 因此 未 受伤 害 并 
且 与 平常 一 样 发 挥 着 作用 。 此 外 ， 大 多 数 本 地 DNS 服务 器 缓存 了 顶级 域名 服务 器 的 IP 
地 址 ， 使 得 这 些 请 求 过 程 通常 绕 过 了 DNS 根 服务 器 。 | 

xt DNS 的 潜在 更 为 有 效 的 DDoS 攻击 将 是 向 顶级 域名 服务 器 (例如 向 所 有 处 理 . com 
域 的 顶级 域名 服务 器 ) 发 送 大 量 的 DNS 请 求 。 过 滤 指 向 DNS 服务 器 的 DNS 请 求 将 更 为 
困难 ， 并 且 顶 级 域名 服务 器 不 像 根 服务 器 那样 容易 绕 过 。 但 是 这 种 攻击 的 严重 性 通过 本 
地 DNS 服务 器 中 的 缓存 技术 可 将 部 分 地 被 缓解 。 

DNS 能 够 潜在 地 以 其 他 方式 被 攻击 。 在 中 间 人 攻击 中 ， 攻 击 者 截获 来 自主 机 的 请 求 
并 返回 伪造 的 回答 。 在 DNS 毒害 攻击 中 ， 攻 击 者 向 一 台 DNS 服务 器 发 送 伪造 的 回答 ， 
诱 使 服务 器 在 它 的 缓存 中 接收 伪造 的 记录 。 这 些 攻击 中 的 任 一 种 ， 都 能 够 将 毫 无 疑虑 的 
Web 用 户 重 定向 到 攻击 者 的 Web 站 点 。 然 而 ， 这 些 攻击 难以 实现 ， 因 为 它们 要 求 截获 
分 组 或 扼 制 住 服务 器 [Skoudis 2006 | 。 

总 而 言 之 ，DNS 自身 已 经 显示 了 对 抗 攻击 的 令 人 惊讶 的 健壮 性 。 至 今 为 止 ， 还 没有 
一 个 攻击 已 经 成 功 地 妨碍 了 DNS 服务 。 














2.5 P2P 文件 分 发 


在 目前 为 止 本 章 中 描述 的 应 用 (包括 Web 、 电 子 邮 件 和 DNS) 都 采用 了 客户 -服务 器 
体系 结构 ， 极 大 地 依赖 于 总 是 打开 的 基础 设施 服务 器 。2. 1. 1 节 讲 过 ,使 用 P2P 体系 结 
构 ， 对 总 是 打开 的 基础 设施 服务 器 有 最 小 的 (或 者 没有 ) 依赖 。 与 之 相反 ， 成 对 间歇 连接 
的 主机 ( 称 为 对 等 方 ) 彼此 直接 通信 。 这 些 对 等 方 并 不 为 服务 提供 商 所 拥有 ， 而 是 受用 户 
控制 的 桌面 计算 机 和 膝 上 计算 机 。 

在 本 节 中 我 们 将 研究 一 个 非常 自然 的 P2P 应 用 ， 即 从 单一 服务 器 向 大 量 主机 ( 称 为 对 
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等 方 ) 分 发 一 个 大 文件 。 该 文件 也 许 是 一 个 新 版 的 Linux 操作 系统 ， 对 于 现 有 操作 系统 或 
应 用 程序 的 一 个 软件 补丁 ， 一 个 MP3 音乐 文件 ， 或 一 个 MPEG 视频 文件 。 在 客户 -服务 
器 文件 分 发 中 ， 该 服务 器 必须 向 每 个 对 等 方 发 送 该 文件 的 一 个 副本 ， 即 服务 器 承受 了 极 大 
的 负担 ， 并 且 消 耗 了 大 量 的 服务 器 带宽 。 在 P2P 文件 分 发 中 ， 每 个 对 等 方 能 够 向 任何 其 他 
对 等 方 重新 分 发 它 已 经 收 到 的 该 文件 的 任何 部 分 ， 从 而 在 分 发 过 程 中 协助 该 服务 器 。 到 
2016 年 止 ， 最 为 流行 的 P2P 文件 分 发 协议 是 BitTorrent。 该 应 用 程序 最 初 由 Bram Cohen 所 
研发 ， 现 在 有 许多 不 同 的 独立 且 符 合 BitTorrent 协议 的 BitTorrent 客户 ， 就 像 有 许多 符合 
HTTP 协议 的 Web 浏览 器 客户 一 样 。 在 下 面 的 小 节 中 ， 我 们 首先 考察 在 文件 分 发 环境 中 的 
POP 体系 结构 的 自 扩展 性 。 然 后 我 们 更 为 详细 地 描述 BitTorrent, 突出 它 的 最 为 重要 的 特性 
和 特色 。 
1. P2P 体系 结构 的 扩展 性 


为 了 将 客户 -服务 器 体系 结构 与 P2P 体系 结构 进行 比较 ,阐述 PP 的 内 在 自 扩展 性 ， 
我 们 现在 考虑 一 个 用 于 两 种 体系 结构 类 型 的 简单 定量 模型 ， 将 一 个 文件 分 发 给 一 个 固定 对 
等 方 集合 。 如 图 2-21 所 示 ， 服 务 器 和 对 等 方 使 用 接 人 链 路 与 因特网 相连 。 其 中 u, 表示 服 
务 器 接 入 链 路 的 上 载 速率 ，u, 表示 第 对 等 方 接 人 链 路 的 上 载 速率 ，di; 表示 了 第 i 对 等 方 
接 人 链 路 的 下 载 速率 。 还 用 下 表示 被 分 发 的 文件 长 度 (以 比特 计 ) ,NN 表示 要 获得 的 该 文 
件 副本 的 对 等 方 的 数量 。 分 发 时 间 (distribution time) 是 所 有 N 个 对 等 方 得 到 该 文件 的 副 
本 所 需要 的 时 间 。 在 下 面 分 析 分 发 时 间 的 过 程 中 ， 我 们 对 客户 -服务 器 和 P2P 体系 结构 做 
了 简化 〈 并 且 通 常 是 准确 的 [Akela 2003]) 的 假设 ， 即 因特网 核心 具有 足够 的 带宽 ， 这 
意味 着 所 有 瓶颈 都 在 网 络 接 入 链 路 。 我 们 还 假设 服务 器 和 客户 没有 参与 任何 其 他 网 络 应 
用 ， 因 此 它们 的 所 有 上 传 和 下 载 访问 带宽 能 被 全 部 用 于 分 发 该 文件 。 
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图 2-21 文件 分 发 问题 的 示例 图 


我 们 首先 来 确定 对 于 客户 - 服务 器 体系 结构 的 分 发 时 间 ， 我 们 将 其 表示 为 Dao EK 
P -服务 器 体系 结构 中 ， 没 有 对 等 方 参与 来 帮助 分 发 文件 。 我 们 做 下 列 观察 : 





e 
>a 
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© 服务 器 必须 向 N 个 对 等 方 的 每 个 传输 该 文件 的 一 个 副本 。 因 此 该 服务 器 必须 传输 
NF 比特 。 因 为 该 服务 器 的 上 载 速 率 是 u, 分 发 该 文件 的 时 间 必 定 是 至 少 为 
NF/w.,s 
© 令 du 表示 具有 最 小 下 载 速率 的 对 等 方 的 下 载 速 率 ， 即 dan =min|d,, d,, - 
dl。 具 有 最 小 下 载 速 率 的 对 等 方 不 可 能 在 少 于 F/di, 秒 时 间 内 获得 该 文件 的 所 有 
F 比特 。 因 此 最 小 分 发 时 间 至 少 为 F/d nino 
将 这 两 个 观察 放 在 一 起 ， 我 们 得 到 
NF F 
D Z mafo] 
该 式 提供 了 对 于 客户 -服务 器 体系 结构 的 最 小 分 发 时 间 的 下 界 。 在 课 后 习题 中 将 请 你 
给 出 服务 器 能 够 调度 它 的 传输 以 便 实际 取得 该 下 界 的 方法 。 因 此 我 们 取 上 面 提供 的 这 个 下 
界 作 为 实际 发 送 时 间 ， 即 


D., = max{ -人 (2-1) 


我 们 从 式 (2-1) 看 到 ， 对 足够 大 的 VN， 客户 - 服务 器 分 发 时 间 由 NF /u, 确定 。 所 以 ， 
该 分 发 时 间 随 着 对 等 方 N 的 数量 线性 地 增加 。 因 此 举例 来 说 ， 如 果 从 某 星 期 到 下 星期 对 等 
方 的 数量 从 1000 增加 了 1000 倍 ， 到 了 100 万 ,将 该 文件 分 发 到 所 有 对 等 方 所 需要 的 时 间 
就 要 增加 1000 fÈ 
我 们 现在 来 对 P2P 体系 结构 进行 简单 的 分 析 ， 其 中 每 个 对 等 方 能 够 帮助 服务 器 分 发 该 
文件 。 特 别 是 ， 当 一 个 对 等 方 接收 到 某 些 文件 数据 ， 它 能 够 使 用 自己 的 上 载 能 力 重新 将 数 
据 分 发 给 其 他 对 等 方 。 计 算 P2P 体系 结构 的 分 发 时 间 在 某 种 程度 上 比 计算 客户 - 服务 器 体 
系 结构 的 更 为 复杂 ， 因 为 分 发 时 间 取 决 于 每 个 对 等 方 如 何 向 其 他 对 等 方 分 发 该 文件 的 各 个 
部 分 。 无 论 如 何 ， 能 够 得 到 对 该 最 小 分 发 时 间 的 一 个 简单 表示 式 [Kumar 2006]。 至 此 ， 
我 们 先 做 下 列 观察 : 
© 在 分 发 的 开始 ， 只 有 服务 器 具有 文件 。 为 了 使 社区 的 这 些 对 等 方 得 到 该 文件 ， 
服务 器 必须 经 其 接 入 链 路 至 少 发 送 该 文件 的 每 个 比特 一 次 。 因 此 ， co 
至 少 是 F/u o (与 客户 - 服务 器 方案 不 同 ， 由 服务 器 发 送 过 一 次 的 比特 可 能 不 必 
由 该 服务 器 再 次 发 送 ， 因 为 对 等 方 在 它们 之 间 可 以 重新 分 发 这 些 比特 。) 
e 与 客户 -服务 器 体系 结构 相同 ， 具 有 最 低下 载 速率 的 对 等 方 不 能 够 以 小 于 F/d nin 
秒 的 分 发 时 间 获 得 所 有 比特 。 因 此 最 小 分 发 时 间 至 少 为 F/d,,,。 
。 最 后 ， 观 察 到 系统 整体 的 总 上 载 能 力 等 于 服务 器 的 上 载 速 率 加 上 每 个 单独 的 对 等 
方 的 上 载 速 率 ， 即 uw =u, +u + + Uys 系统 必须 向 这 N 个 对 等 方 的 每 个 交付 
(ER) F 比特 ， 因 此 总 共 交 付 NF 比特 。 这 不 能 以 快 于 wu 的 速率 完成 。 因 此 ， 
最 小 的 分 发 时 间 也 至 少 是 NF/(u, +u + +uy)o 
将 这 三 个 观察 放 在 一 起 ， 我 们 获得 了 对 P2P 的 最 小 分 发 时 间 ， 表 示 为 Doro 
E FE NF 
“da” u, + SH 
式 (2-2) 提供 了 对 于 P2P 体系 结构 的 最 小 分 发 时 间 的 下 界 。 这 说 明 ， 如 果 我 们 认为 


一 旦 每 个 对 等 方 接收 到 一 个 比特 就 能 够 重 分 发 一 个 比特 的 话 ， 则 存在 一 个 重新 分 发 方案 能 
实际 取得 这 种 下 界 [Kumar 2006 ] 。( 我 们 将 在 课 后 习题 中 证 明 该 结果 的 一 种 特 情形 。) 实 


(2-2) 


Dig = a 
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际 上 ， 被 分 发 的 是 文件 块 而 不 是 一 个 个 比特 。 式 (2-2) 能 够 作为 实际 最 小 分 发 时 间 的 很 
好 近似 。 因 此 ,我 们 取 由 式 (2-2) 提供 的 下 界 作为 实际 的 最 小 分 发 时 间 ， 即 


F F NF 
Dop = | : ; y | 
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图 2-22 比较 了 客户 - 服务 器 和 P2P 体系 结构 的 最 小 分 发 时 间 ， 其 中 假定 所 有 的 对 等 
方 具有 相同 的 上 载 速率 u, ÆR 2-22 中 ， 我 们 已 经 设置 了 F/u=1 小 时 , u,=10u, dmn > 
uo 因此 ， 在 一 个 小 时 中 一 个 对 等 方 能 够 传输 整个 文件 ， 该 服务 器 的 传输 速率 是 对 等 方 上 
载 速率 的 10 fF, 并且 (为 了 简化 起 见 ) 3. 
对 等 方 的 下 载 速率 被 设置 得 足够 大 ， 使 
之 不 会 产生 影响 。 我 们 从 图 2-22 中 看 到 ， 客户 -服务 器 
对 于 客户 - 服务 器 体系 结构 ， 随 着 对 等 BZ 
方 数量 的 增加 ， 分 发 时 间 呈 线性 增长 并 
且 没 有 界 。 然 而 ， 对 于 P2P 体系 结构 ， 
最 小 分 发 时 间 不 仅 总 是 小 于 客户 - 服务 
器 体系 结构 的 分 发 时 间 ， 并 且 对 于 任意 
的 对 等 方 数量 W， 总 是 小 于 1 小 时 。 因 
此 ,具有 P2P 体系 结构 的 应 用 程序 能 够 
是 自 扩展 的 。 这 种 扩展 性 的 直接 成 因 是 : 
对 等 方 除了 是 比特 的 消费 者 外 还 是 它们 
的 重新 分 发 者 。 

2. BitTorrent 


BitTorrent 是 一 种 用 于 文件 分 发 的 流行 P2P 协议 [Chao 2011 ] 。 用 BitTorrent 的 术语 来 
讲 ， 参 与 一 个 特定 文件 分 发 的 所 有 对 等 方 的 集合 被 称 为 一 个 洪流 (torrent) 。 在 一 个 洪流 
中 的 对 等 方 彼此 下 载 等 长 度 的 文件 块 〈chunk) ， 典 型 的 块 长 度 为 256KB。 当 一 个 对 等 方 首 
次 加 入 一 个 洪流 时 ， 它 没有 块 。 随 着 时 间 的 流逝 ， 它 累积 了 越 来 越 多 的 块 。 当 它 下 载 块 
时 ， 也 为 其 他 对 等 方 上 载 了 多 个 块 。 一 旦 某 对 等 方 获得 了 整个 文件 ， 它 也 许 (自私 地 ) 高 
开 洪 流 ， 或 (大公无私 地 ) 留 在 该 洪流 中 并 继续 向 其 他 对 等 方 上 载 块 。 同 时 ,任何 对 等 方 
可 能 在 任何 时 候 仅 具 有 块 的 子 集 就 离开 该 洪流 ， 并 在 以 后 重新 加 入 该 洪流 中 。 

我 们 现在 更 为 仔细 地 观察 BitTorrent 运行 的 过 程 。 因 为 BitTorrent 是 一 个 相当 复杂 的 协 
议 ， 所 以 我 们 将 仅 描述 它 最 重要 的 机 制 ， 而 对 某 些 细节 视而不见 ; 这 将 使 得 我 们 能 够 通过 
树木 看 森林 。 每 个 洪流 具有 一 个 基础 设施 节点 ， 称 为 追踪 器 (tracker) 。 当 一 个 对 等 方 加 
入 某 洪 流 时 ， 它 向 追踪 器 注册 自己 ， 并 周期 性 地 通知 追踪 器 它 仍 在 该 洪流 中 。 以 这 种 方 
式 ， 追 踪 器 跟踪 参与 在 洪流 中 的 对 等 方 。 一 个 给 定 的 洪流 可 能 在 任何 时 刻 具 有 数 以 百 计 或 
数 以 千 计 的 对 等 方 。 

如 图 2-23 所 示 ， 当 一 个 新 的 对 等 方 Alice 加 入 该 洪流 时 ， 追 踪 器 随机 地 从 参与 对 等 方 
的 集合 中 选择 对 等 方 的 一 个 子 集 (为 了 具体 起 见 ， 设 有 50 个 对 等 方 ) ， 并 将 这 50 个 对 等 
方 的 下 地 址 发 送 给 Alice。Alice 持 有 对 等 方 的 这 张 列 表 ， 试 图 与 该 列表 上 的 所 有 对 等 方 创 
建 并 行 的 TCP 连接。 我 们 称 所 有 这 样 与 Alice 成 功 地 创建 一 个 TCP 连接 的 对 等 方 为 “邻近 
对 等 方 ”( 在 图 2-23 中 ，Alice 显示 了 仅 有 三 个 邻近 对 等 方 。 通 常 ， 她 应 当 有 更 多 的 对 等 
方 ) 。 随 着 时 间 的 流逝 ， 这 些 对 等 方 中 的 某 些 可 能 离开 ， 其 他 对 等 方 〈 最 初 50 个 以 外 的 ) 
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可 能 试图 与 Alice 创建 TCP 连接 。 因 此 一 个 对 等 方 的 邻近 对 等 方 将 随时 间 而 波动 。 
追踪 器 对 等 方 


有 






获得 对 等 方 
的 列表 


图 2-23 用 BitTorrent 分 发 文件 


在 任何 给 定 的 时 间 ， 每 个 对 等 方 将 具有 来 自 该 文件 的 块 的 子 集 ， 并 且 不 同 的 对 等 方 具 
有 不 同 的 子 集 。Alice 周期 性 地 (经 TCP 连接 ) 询问 每 个 邻近 对 等 方 它们 所 具有 的 块 列表 。 
如 果 Alice 具有 工 个 不 同 的 邻居 ， 她 将 获得 二 个 块 列表 。 有 了 这 个 信息 ，Alice 将 对 她 当前 
还 没有 的 块 发 出 请 求 〈 仍 通过 TCP 连接 ) 。 

因此 在 任何 给 定 的 时 刻 ，Alice 将 具有 块 的 子 集 并 知道 它 的 邻居 具有 哪些 块 。 利 用 这 
些 信 息 ，Alice 将 做 出 两 个 重要 决定 。 第 一 ， 她 应 当 从 她 的 邻居 请 求 哪些 块 呢 ? 第 二 ， 她 
应 当 向 哪些 向 她 请 求 块 的 邻居 发 送 块 ? 在 决定 请 求 哪些 块 的 过 程 中 ，Alice 使 用 一 种 称 为 
最 稀缺 优先 ( rarest first) 的 技术 。 这 种 技术 的 思路 是 ， 针 对 她 没有 的 块 在 她 的 邻居 中 决定 
最 稀缺 的 块 (最 稀缺 的 块 就 是 那些 在 她 的 邻居 中 副本 数量 最 少 的 块 )， 并 首先 请 求 那些 最 
稀缺 的 块 。 这 样 ， 最 稀缺 块 得 到 更 为 迅速 的 重新 分 发 ， 其 目标 是 (大致 地 ) 均衡 每 个 块 在 
洪流 中 的 副本 数量 。 

为 了 决定 她 响应 哪个 请 求 ，BitTorrent 使 用 了 一 种 机 灵 的 对 换算 法 。 其 基本 想法 是 ， 
Alice 根据 当前 能 够 以 最 高 速率 向 她 提供 数据 的 邻居 ， 给 出 其 优先 权 。 特 别 是 ，Alice 对 于 
她 的 每 个 邻居 都 持续 地 测量 接收 到 比特 的 速率 ， 并 确定 以 最 高 速率 流入 的 4 个 邻居 。 每 过 
10 秒 ; 她 重新 计算 该 速率 并 可 能 修改 这 4 个 对 等 方 的 集合 。 用 BitTorrent 术语 来 说 ， 这 4 
个 对 等 方 被 称 为 疏通 〈unchoked) 。 重 要 的 是 ， 每 过 30 秒 ， 她 也 要 随机 地 选择 另外 一 个 邻 
居 并 向 其 发 送 块 。 我 们 将 这 个 被 随机 选择 的 对 等 方 称 为 Bob。 因 为 Alice 正在 向 Bob 发 送 
数据 ， 她 可 能 成 为 Bob 前 4 位 上 载 者 之 一 ， 这 样 的 话 Bob 将 开始 向 Alice 发 送 数据 。 如 果 
Bob 向 Alice 发 送 数据 的 速率 足够 高 ，Bob 接 下 来 也 能 成 为 Alice 的 前 4 位 上 载 者 。 换 言 之 ， 
每 过 30 秒 Alice 将 随机 地 选择 一 名 新 的 对 换 伴侣 并 开始 与 那 位 伴侣 进行 对 换 。 如 果 这 两 名 
对 等 方 都 满足 此 对 换 ， 它 们 将 对 方 放 人 其 前 4 位 列表 中 并 继续 与 对 方 进行 对 换 ， 直 到 该 对 
等 方 之 一 发 现 了 一 个 更 好 的 伴侣 为 止 。 这 种 效果 是 对 等 方 能 够 以 趋向 于 找到 彼此 的 协调 的 
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速率 上 载 。 随 机 选择 邻居 也 允许 新 的 对 等 方 得 到 块 ， 因 此 它们 能 够 具有 对 换 的 东西 。 除 了 
这 5 个 对 等 方 (“前 ”4 个 对 等 方 和 一 个 试探 的 对 等 方 ) 的 所 有 其 他 相 邻 对 等 方 均 被 “ 阻 
HE”, ， 即 它们 不 能 从 Alice 接收 到 任何 块 。BitTorrent 有 一 些 有 趣 的 机 制 没 有 在 这 里 讨论 ， 
包括 片 〈 小 块 ) 、 流 水 线 、 随 机 优先 选择 Ae ey AI BM [Cohen 2003 ] 。 

刚刚 描述 的 关于 交换 的 激励 机 制 常 被 称 为 “一 报 还 一 报 ” (tit-for-tat) [ Cohen 2003 ] 。 
已 证 实 这 种 激励 方案 能 被 回避 [ Liogkas 2006; Locher 2006; Piatek 2007 ] 。 无 论 如 何 ， 
BitTorrent“ 生 态 系统 ”取得 了 广泛 成 功 ， 数 以 百 万 计 的 并 发 对 等 方 在 数 十 万 条 洪流 中 积极 
地 共享 文件 。 如 果 BitTorrent 被 设计 为 不 采用 一 报 还 一 报 (或 一 种 变种 ) ， 然 而 在 别 的 方面 
却 完全 相同 的 协议 ，BitTorrent 现在 将 很 可 能 不 复 存 在 了 ， 因 为 大 多 数 用 户 将 成 为 搭便 车 
者 了 [Sarouiu 2002 ] 。 

我 们 简要 地 提 一 下 男 一 种 P2P 应 用 一 一 分 布 式 散 列表 (DHT) 来 结束 我 们 的 讨论 。 分 
布 式 散 列表 是 一 种 简单 的 数据 库 ， 其 数据 库 记 录 分 布 在 一 个 PP 系统 的 多 个 对 等 方 上 。 
DHT 得 到 了 广泛 实现 (如 在 BitTorrent 中 ) ， 并 成 为 大 量 研究 的 主题 。 在 配套 网 站 的 Video 
Note 中 对 DHT 进行 了 概述 。 


2.6 视频 流 和 内 容 分 发 网 


事先 录制 的 流 式 视频 现在 是 北美 住宅 ISP 中 的 流量 主体 。 特 别 是 ，Netflix 和 YouTube 
在 2015 年 分 别 消耗 了 住宅 ISP 流量 的 37% A 16% [Sandvine 2015 ] 。 在 本 节 中 ， 我 们 将 对 
如 何在 今天 的 因特网 中 实现 流行 的 视频 流 服务 进行 概述 。 我 们 将 看 到 它们 的 实现 方式 是 使 
用 应 用 层 协议 和 以 像 高 速 缓存 那样 方式 运行 的 服务 器 。 在 专注 于 多 媒体 网 络 的 第 9 章 中 ， 
我 们 将 进一步 研究 因特网 视频 以 及 其 他 因特网 多 媒体 服务 。 


2.6.1 因特网 视频 


在 流 式 存 储 视 频 应 用 中 ， 基 础 的 媒体 是 预先 录制 的 视频 ， 例 如 电影 、 电 视 节 目 、 录 制 
好 的 体育 事件 或 录制 好 的 用 户 生成 的 视频 (如 通常 在 YouTube 上 可 见 的 那些 ) 。 这 些 预先 
录制 好 的 视频 放置 在 服务 器 上 ， 用 户 按 需 向 这 些 服 务 器 发 送 请 求 来 观看 视频 。 许 多 因特网 
公司 现在 提供 流 式 视频 ， 这 些 公司 包括 Netflix, YouTube (谷歌 )、 亚 马 逊 和 优酷 。 

但 在 开始 讨论 视频 流 之 前 ， 我 们 先 迅 速 感受 一 下 视频 媒体 自身 。 视 频 是 一 系列 的 图 像 ， 
通常 以 一 种 恒定 的 速率 (如 每 秒 24 或 30 张 图 像 ) 来 展现 。 一 幅 未 压缩 、 数 字 编 码 的 图 像 由 
像素 阵列 组 成 ， 其 中 每 个 像素 是 由 一 些 比特 编码 来 表示 亮度 和 颜色 。 视 频 的 一 个 重要 特征 是 
它 能 够 被 压缩 ， 因 而 可 用 比特 率 来 权衡 视频 质量 。 今 天 现成 的 压缩 算法 能 够 将 一 个 视频 压缩 
成 所 希望 的 任何 比特 率 。 当 然 ， 比 特 率 越 高 ， 图 像 质 量 越 好 ， 用 户 的 总 体 视觉 感受 越 好 。 

从 网 络 的 观点 看 ， 也 许 视频 最 为 突出 的 特征 是 它 的 高 比特 率 。 压 缩 的 因特网 视频 的 比 
特 率 范 围 通常 从 用 于 低 质量 视频 的 100kbps， 到 用 于 流 式 高 分 辩 率 电影 的 超过 3Mbps， 再 
到 用 于 4K 流 式 展 望 的 超过 10Mbps。 这 能 够 转换 为 巨大 的 流量 和 存储 ， 特 别 是 对 高 端 视 
频 。 例 如 ， 单 一 2Mbps 视频 在 67 分 钟 期 间 将 耗费 1GB 的 存储 和 流量 。 到 目前 为 止 ， 对 流 
式 视频 的 最 为 重要 的 性 能 度量 是 平均 端 到 端 吞 吐 量 。 为 了 提供 连续 不 断 的 布局 ， 网 络 必须 
为 流 式 应 用 提供 平均 吞吐 量 ， 这 个 流 式 应 用 至 少 与 压缩 视频 的 比特 率 一 样 大 。 

我 们 也 能 使 用 压缩 生成 相同 视频 的 多 个 版 本 ， 每 个 版 本 有 不 同 的 质量 等 级 。 例 如 ， 我 
们 能 够 使 用 压缩 生成 相同 视频 的 3 个 版 本 ， 比 特 率 分 别 为 300kbps、1Mbps 和 3Mbps。 用 户 





则 能 够 根据 他 们 当前 可 用 带宽 来 决定 观看 哪个 版 本 。 具 有 高 速 因特网 连接 的 用 户 也 许 选择 
3Mbps 版 本 ， 使 用 智能 手机 通过 3G 观看 视频 的 用 户 可 能 选择 300kbps 版 本 。 


2.6.2 HTTP 流 和 DASH 


在 HTTP 流 中 ， 视 频 只 是 存储 在 HTTP 服务 器 中 作为 一 个 普通 的 文件 ， 每 个 文件 有 一 
个 特定 的 URL。 当 用 户 要 看 该 视频 时 ， 客 户 与 服务 器 创建 一 个 TCP 连接 并 发 送 对 该 URL 
的 HTTP GET 请 求 。 服 务 器 则 以 底层 网 络 协 议和 流量 条 件 允 许 的 尽 可 能 快 的 速率 ， 在 一 个 
HTTP 响应 报 文中 发 送 该 视频 文件 。 在 客户 一 侧 ， 字 节 被 收集 在 客户 应 用 组 在 中。 一旦 该 
缓存 中 的 字 节 数量 超过 预先 设 定 的 门限 ， 客 户 应 用 程序 就 开始 播放 ， 特 别 是 ， 流 式 视频 应 
用 程序 周期 性 地 从 客户 应 用 程序 缓存 中 抓 取 帧 ， 对 这 些 帧 解压 缩 并 且 在 用 户 屏幕 上 展现 。 
因此 ， 流 式 视频 应 用 接收 到 视频 就 进行 播放 ， 同 时 缓存 该 视频 后 面部 分 的 帧 。 

如 前 一 小 节 所 述 ， 尽 管 HTTP 流 在 实践 中 已 经 得 到 广泛 部 署 (PU, A YouTube 发 展 
初期 开始 ) ， 但 它 具 有 严重 缺陷 ， 即 所 有 客户 接收 到 相同 编码 的 视频 ， 尽 管 对 不 同 的 客户 
或 者 对 于 相同 客户 的 不 同时 间 而 言 ， 客 户 可 用 的 带宽 大 小 有 很 大 不 同 。 这 导致 了 一 种 新 型 
基于 HTTP 的 流 的 研发 ， 它 常常 被 称 为 经 HTTP 的 动态 适应 性 流 (Dynamic Adaptive 
Streaming over HTTP, DASH), Æ DASH F, 视频 编 码 为 几 个 不 同 的 版 本 ， 其 中 每 个 版 本 
具有 不 同 的 比特 率 ， 对 应 于 不 同 的 质量 水 平 。 客 户 动态 地 请 求 来 自 不 同 版 本 且 长 度 为 几 秒 
的 视频 段 数 据 块 。 当 可 用 带宽 量 较 高 时 ， 客 户 自然 地 选择 来 自 高 速率 版 本 的 块 ; 当 可 用 带 
宽 量 较 低 时 ， 客 户 自然 地 选择 来 自 低 速率 版 本 的 块 。 客 户 用 HTTP GET 请 求 报 文 一 次 选择 
一 个 不 同 的 块 [ Akhshabi 2011 ] 。 

DASH 允许 客户 使 用 不 同 的 以 太 网 接 人 速率 流 式 播放 具有 不 同 编码 速率 的 视频 。 使 用 
低速 3G 连接 的 客户 能 够 接收 一 个 低 比特 率 〈 和 低 质量 ) 的 版 本 ,使 用 光纤 连接 的 客户 能 
够 接收 高 质量 的 版 本 。 如 果 端 到 端 带宽 在 会 话 过 程 中 改变 的 话 ，DASH 允许 客户 适应 可 用 
带宽 。 这 种 特色 对 于 移动 用 户 特别 重要 ， 当 移动 用 户 相 对 于 基站 移动 时 ， 通 常 他 们 能 感受 
到 其 可 用 带宽 的 波动 。 

使 用 DASH 后 ， 每 个 视频 版 本 存储 在 HTTP 服务 器 中 ， 每 个 版 本 都 有 一 个 不 同 的 
URL, HTTP 服务 器 也 有 一 个 告示 文件 (manifest 包 e) ， 为 每 个 版 本 提供 了 一 个 URL 及 其 
比特 率 。 客 户 首先 请 求 该 告示 文件 并 且 得 知 各 种 各 样 的 版 本 。 然 后 客户 通过 在 HTTP GET 
请 求 报 文中 对 每 块 指定 一 个 URL 和 一 个 字 节 范围 ， 一 次 选择 一 块 。 在 下 载 块 的 同时 ， 客 
户 也 测量 接收 带宽 并 运行 一 个 速率 决定 算法 来 选择 下 次 请 求 的 块 。 自 然 地 ， 如 果 客 户 缓存 
的 视频 很 多 ， 并 且 测 量 的 接收 带宽 较 高 ， 它 将 选择 一 个 高 速率 的 版 本 。 同 样 ， 如 果 客 户 缓 
存 的 视频 很 少 ， 并 且 测 量 的 接收 带宽 较 低 ， 它 将 选择 一 个 低速 率 的 版 本 。 因 此 DASH 允许 
客户 自由 地 在 不 同 的 质量 等 级 之 间 切 换 。 


2. 6.3 内 容 分 发 网 


今天 ， 许 多 因特网 视频 公司 日 复 一 日 地 向 数 以 百 万 计 的 用 户 按 需 分 发 每 秒 数 兆 比 特 的 
流 。 例 如 ，YouTube 的 视频 库 藏 有 几 亿 个 ， 每 天 向 全 世界 的 用 户 分 发 几 亿 条 流 。 向 位 于 全 世 
界 的 所 有 用 户 流 式 传输 所 有 流量 同时 提供 连续 播放 和 高 交互 性 显然 是 一 项 有 挑战 性 的 任务 。 

对 于 一 个 因特网 视频 公司 ， 或 许 提供 流 式 视频 服务 最 为 直接 的 方法 是 建立 单一 的 大 规 
模 数据 中 心 ， 在 数据 中 心中 存储 其 所 有 视频 ， 并 直接 从 该 数据 中 心 向 世界 范围 的 客户 传输 
流 式 视 频 。 但 是 这 种 方法 存在 三 个 问题 。 首 先 ， 如 果 客 户 远离 数据 中 心 ， 服 务 器 到 客户 的 
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分 组 将 跨越 许多 通信 链 路 并 很 可 能 通过 许多 ISP， 其 中 某 些 ISP 可 能 位 于 不 同 的 大 洲 。 如 
果 这 些 链 路 之 一 提供 的 吞吐 量 小 于 视频 消耗 速率 ， 端 到 端 符 吐 量 也 将 小 于 该 消耗 速率 ， 给 
用 户 带 来 恼人 的 停滞 时 延 。( 第 1 章 讲 过 ,一 条 流 的 端 到 端 吞吐 量 由 瓶颈 链 路 的 吞吐 量 所 
HE.) 出 现 这 种 事件 的 可 能 性 随 着 端 到 端 路 径 中 链 路 数量 的 增加 而 增加 。 第 二 个 缺陷 是 
流行 的 视频 很 可 能 经 过 相同 的 通信 和 链 路 发 送 许多 次 。 这 不 仅 浪费 了 网 络 带 宽 ， 因 特 网 视频 
公司 自己 也 将 为 向 因特网 反复 发 送 相同 的 字 节 而 向 其 ISP 运营 商 ( 连 接 到 数据 中 心 ) 支付 
费用 。 这 种 解决 方案 的 第 三 个 问题 是 单个 数据 中 心 代表 一 个 单 点 故障 ， 如 果 数 据 中 心 或 其 
通 向 因特网 的 链 路 崩 演 ， 它 将 不 能 够 分 发 任何 视频 流 了 。 

为 了 应 对 向 分 布 于 全 世界 的 用 户 分 发 巨 量 视频 数据 的 挑战 ， 几 乎 所 有 主要 的 视频 流 公 
司 都 利用 内 容 分 发 网 (Content Distribution Network, CDN), CDN 管理 分 布 在 多 个 地 理 位 置 
上 的 服务 器 ， 在 它 的 服务 器 中 存储 视频 (和 其 他 类 型 的 Web 内容 ， 包 括 文档 、 图 片 和 音 
m) 的 副本 ， 并 且 所 有 试图 将 每 个 用 户 请 求 定 向 到 一 个 将 提供 最 好 的 用 户 体验 的 CDN 位 
置 。CDN 可 以 是 专用 CDN (private CDN) ， 即 它 由 内 容 提供 商 自 己 所 拥有 ; 例如 ， 谷歌 的 
CDN 分 发 YouTube 视频 和 其 他 类 型 的 内 容 。 另 一 种 CDN 可 以 是 第 三 方 CDN (third-party 
CDN) ， 它 代表 多 个 内 容 提 供 商 分 发 内 容 ; Akamai、Limelight 和 Level-3 都 运行 第 三 方 
CDN, HAR CDN 的 一 个 可 读 性 强 的 展望 见 [Leighton 2009; Nygren 2010], 





谷歌 的 网 络 基础 设施 


为 了 支持 谷歌 的 巨 量 云 服 务 阵列 ， 和 包括 搜 索 、Gmail、 日 程 表 、YouTube 视频 、 地 
图 、 文 档 和 社交 网 络 ， 谷 歌 已 经 部 署 了 一 个 广泛 的 专用 网 和 CDN 基础 设施 。 谷 歌 的 
CDN 基础 设施 具有 三 个 等 级 的 服务 器 集群 : 

© 14 个 “ 百 万 数据 中 心 ”， 其 中 8 个 位 于 北美 ，4 个 位 于 欧洲 ，2 个 位 于 亚洲 [Google 

Locations 2016] ， 每 个 数据 中 心 具 有 10 万 台 量 级 的 服务 器 。 这 些 “ 百 万 数据 中 心 ” 
负责 服务 于 动态 的 (并 且 经 常 是 个 性 化 的 ) 内 容 ， 包 括 搜索 结果 和 Gmail 报 文 。 

© EDP PKA 50 个 集群 分 布 于 全 球 ， 其 中 每 个 集群 由 100 ~500 台 服 务 器 组 成 

[ Adhikari 2011a] 。 这 些 集 群 负责 服务 于 静态 内 容 ， 包 括 YouTube 视频 [Adhikari 
2011a]。 

© 数 以 百 计 的 “深入 (enter- deep) ”集群 位 于 一 个 接 入 ISP 中 。 这 里 一 个 集群 通 

常 由 位 于 一 个 机 架 上 的 数 十 台 服 务 器 组 成 。 这 些 “ 深 入 服务 器 ”执行 TCP PE 
(参见 3.7 节 ) 并 服务 于 静态 内 容 [Chen 2011] ， 包 括 体现 搜索 结果 的 Web 网 
页 的 静态 部 分 。 

所 有 这 些 数据 中 心 和 集群 位 置 与 谷歌 自己 的 专用 网 连接 在 一 起 。 当 某 用 户 进行 搜索 
请 求 时 ， 该 请 求 常 常 先 经 过 本 地 ISP 发 送 到 邻近 的 “深入 服务 器 ”缓存 中 ， 从 这 里 检索 
静态 内 容 ; 同时 将 该 静态 内 容 提 供给 客户 ， 邻 近 的 缓存 也 经 谷歌 的 专用 网 将 请 求 转 发 给 
“大 型 数据 中 心 "， 从 这 里 检索 个 性 化 的 搜索 结果 。 对 于 某 YouTube 视频 ， 该 视频 本 身 可 
能 来 自 一 个 “邀请 坐 客服 务 器 ”缓存 ,而 围绕 该 视频 的 Web 网 页 部 分 可 能 来 自 邻 近 的 
“深入 服务 器 ”缓存 ， 国 绕 该 视频 的 广告 来 自 数 据 中 心 。 总 的 来 说 ， 除 了 本 地 ISP， 谷 
歌 云 服务 在 很 大 程度 上 是 由 独立 于 公共 因特网 的 网 络 基 础 设施 提供 的 。 
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CDN 通常 采用 两 种 不 同 的 服务 器 安置 原则 [ Huang 2008 ] : 
。 深入 。 第 一 个 原则 由 Akamai 首创 ,该 原则 是 通过 在 遍及 全 球 的 接 入 ISP 中 部 署 服 
务 器 集群 来 深入 到 ISP 的 接 入 网 中 。( 在 1.3 节 中 描述 了 接 入 网 。) Akamai 在 大 约 
1700 个 位 置 采 用 这 种 方法 部 署 集群 。 其 目标 是 靠近 端 用 户 ， 通 过 减少 端 用 户 和 
CDN 集群 之 间 ( 内容 从 这 里 收 到 ) 链 路 和 路 由 器 的 数量 ， 从 而 改善 了 用 户 感 受 的 
时 延 和 吞吐 量 。 因 为 这 种 高 度 分 布 式 设计 ， 维 护 和 管理 集群 的 任务 成 为 挑战 。 
。 邀请 做 客 。 第 二 个 设计 原则 由 Limelight 和 许多 其 他 CDN 公司 所 采用 ， 该 原则 是 通 
过 在 少量 (例如 10 个 ) 关键 位 置 建 造 大 集群 来 洲 请 到 ISP 做 客 。 不 是 将 集群 放 在 
接 入 ISP 中 ,这 些 CDN 通常 将 它们 的 集群 放置 在 因特网 交换 点 (XP) (参见 1.3 
节 ) 。 与 深入 设计 原则 相 比 ， 邀 请 做 客 设 计 通 常 产生 较 低 的 维护 和 管理 开销 ， 可 能 
以 对 端 用 户 的 较 高 时 延 和 较 低 吞 吐 量 为 代价 。 
一 旦 CDN 的 集群 准备 就 绪 ， 它 就 可 以 跨 集群 复制 内 容 。CDN 可 能 不 希望 将 每 个 视频 
的 副本 放置 在 每 个 集群 中 ， 因 为 某 些 视频 很 少 观看 或 仅 在 某 些 国家 中 流行 。 事 实 上 ， 许 多 
CDN 没有 将 视频 推 人 它们 的 集群 ， 而 是 使 用 一 种 简单 的 拉 策略 : 如 果 客 户 向 一 个 未 存储 该 
视频 的 集群 请 求 某 视频 ， 则 该 集群 检索 该 视频 (从 某 中 心 仓库 或 者 从 另 一 个 集群 ) ， 向 客 
户 流 式 传输 视频 时 的 同时 在 本 地 存储 一 个 副本 。 类 似 于 因特网 缓存 (参见 2.2.5 9), ¥ 
某 集群 存储 器 变 满 时 ， 它 删除 不 经 常 请 求 的 视频 。 
1. CDN 操作 


在 讨论 过 这 两 种 部 署 CDN 的 重要 方法 后 ， 我 们 现在 深入 看 看 CDN 操作 的 细节 。 当 用 
户主 机 中 的 一 个 浏览 器 指令 检索 一 个 特定 的 视频 (由 URL 标识 ) 时 ，CDN 必须 截获 该 请 
R, MER: 确定 此 时 适合 用 于 该 客户 的 CDN 服务 器 集群 ，@@ 将 客户 的 请 求 重 定向 
到 该 集群 的 某 台 服务 器 。 我 们 很 快 将 讨论 CDN 是 如 何 能 够 确定 一 个 适当 的 集群 的 。 但 是 
我 们 首先 考察 截获 和 重 定向 请 求 所 依赖 的 机 制 。 





大 多 数 CDN 利用 DNS 来 截获 和 重 

定向 请 求 ; 这 种 使 用 DNS 的 一 个 有 趣 A 
讨论 见 [Vixie 2009] 。 我 们 考虑 用 一 个 -一 里 

简单 的 例子 来 说 明 通 常 是 怎样 涉及 DNS O) www. NetCinema.com 
的 。 假 定 一 个 内 容 提 供 商 NetCinema, = | 
雇佣 了 第 三 方 CDN 公司 KingCDN 来 向 gg . © 

其 客户 分 发 视频 。 在 NetCinema 的 Web Beo | EN NetCinema 权 威 
网 页 上 ， 它 的 每 个 视频 都 被 指派 了 一 个 一。 本 地 DNS 服务 器 (0) 。 “NS 服务 器 


URL, 该 URL 包括 了 字符 串 “video” ©) 
以 及 该 视频 本 身 的 独特 标识 符 ; 例如 ， 
转换 器 7 可 以 指派 为 http:/video. 
netcinema. com/6Y7B23V., #2 FE E M 
如 图 2-24 所 示 的 6 个 步骤 : 

1) 用 户 访问 位 于 NetCinema 的 ”图 2-24 DNS 将 用 户 的 请 求 重 定向 到 一 台 CDN 服务 器 
Web 网 页 。 

2) 当 用 户 点 击 链接 http :和 video. netcinema. com/6Y7B23V 时 ， 该 用 户主 机 发 送 了 一 个 





= KingCDN 权 威 
KingCDN 内 容 分 发 服务 器 服务 器 
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对 于 video. netcinema. com 的 DNS 请 求 。 

3) 用 户 的 本 地 DNS 服务 器 (LDNS) 将 该 DNS 请 求 中 继 到 一 台 用 于 NetCinema 的 权 
威 DNS 服务器， 该 服务 器 观察 到 主机 名 video. netcinema. com 中 的 字符 串 “video”。 为 了 将 
该 DNS 请 求 移交 给 KingCDN NetCinema 权威 DNS 服务 器 并 不 返回 一 个 IP 地 址 ， 而 是 向 
LDNS 返回 一 个 KingCDN 域 的 主机 名 ， 如 al105. kingcdn. com。 

4) 从 这 时 起 ，DNS 请 求 进入 了 KingCDN 专用 DNS 基础 设施 。 用 户 的 LDNS 则 发 送 第 
二 个 请 求 ， 此 时 是 对 al105. kingedn. com 的 DNS 请 求 ，KingCDN 的 DNS 系统 最 终 向 -LDNS 
返回 KingCDN 内 容 服务 器 的 IP 地 址 。 所 以 正 是 在 这 里 ， 在 KingCDN 的 DNS 系统 中 ， 指 定 
了 CDN 服务 器 ， 客 户 将 能 够 从 这 人 台 服 务 器 接收 到 它 的 内 容 。 

5) LDNS 向 用 户主 机 转发 内 容 服务 CDN 节点 的 卫 地 址 。 

6) 一 旦 客户 收 到 KingCDN 内 容 服务 器 的 IP 地 址 ， 它 与 具有 该 地 址 的 服务 器 创建 
了 一 条 直接 的 TCP 连接 ， 并且 发 出 对 该 视频 的 HTTP GET 请 求 。 如 果 使 用 了 DASH， 服 务 
器 将 首先 向 客户 发 送 具有 URL 列表 的 告示 文件 ， 每 个 URL 对 应 视频 的 每 个 版 本 ， 并 且 客 
户 将 动态 地 选择 来 自 不 同 版 本 的 块 。 

2. 集群 选择 策略 


任何 CDN 部 署 ， 其 核心 是 集群 选择 策略 ( cluster selection strategy) ， 即 动态 地 将 客户 
定向 到 CDN 中 的 某 个 服务 器 集群 或 数据 中 心 的 机 制 。 如 我 们 刚才 所 见 ， 经 过 客户 的 DNS 
ER, CDN 得 知 了 该 客户 的 LDNS 服务 器 的 卫 地 址 。 在 得 知 该 下 地 址 之 后 ，CDN 需要 基 
于 该 卫 地 址 选择 一 个 适当 的 集群 。CDN 一 般 采 用 专用 的 集群 选择 策略 。 我 们 现在 简单 地 
介绍 一 些 策略 ， 每 种 策略 都 有 其 优点 和 缺点 。 

一 种 简单 的 策略 是 指派 客户 到 地 理 上 最 为 邻近 ( geographically closest) 的 集群 。 使 用 
商用 地 理 位 置 数 据 库 (例如 Quova [ Quova 2016] 和 Max- Mind [ MaxMind 2016]), ， 每 个 
LDNS IP 地 址 都 映射 到 一 个 地 理 位 置 。 当 从 一 个 特殊 的 LDNS 接收 到 一 个 DNS 请 求 时 ， 
CDN 选择 地 理 上 最 为 接近 的 集群 ， 即 离 LDNS 最 少 几 千 米 远 的 集群 ,“ 就 像 鸟 飞 一 样 "。 这 
样 的 解决 方案 对 于 众多 用 户 来 说 能 够 工作 得 相当 好 [Agarwal 2009] 。 但 对 于 某 些 客户 ， 该 
解决 方案 可 能 执行 的 效果 差 ， 因 为 就 网 络 路 径 的 长 度 或 跳 数 而 言 ， 地 理 最 邻近 的 集群 可 能 
并 不 是 最 近 的 集群 。 此 外 ， 一 种 所 有 基于 DNS 的 方法 都 内 在 具有 的 问题 是 ， 某 些 端 用 户 
配置 使 用 位 于 远 地 的 LDNS [Shaikh 2001; Mao 2002 ] ， 在 这 种 情况 下 ，LDNS 位 置 可 能 远 
离 客 户 的 位 置 。 此 外 ， 这 种 简单 的 策略 忽略 了 时 延 和 可 用 带宽 随 因特网 路 径 时 间 而 变化 ， 
总 是 为 特定 的 客户 指派 相同 的 集群 。 

为 了 基于 当前 流量 条 件 为 客户 决定 最 好 的 集群 ，CDN 能 够 对 其 集群 和 客户 之 间 的 时 延 
和 丢 包 性 能 执行 周期 性 的 实时 测量 (real-time measurement), 。 例 如 ，CDN 能 够 让 它 的 每 个 
集群 周期 性 地 向 位 于 全 世界 的 所 有 LONS 发 送 探 测 分 组 (例如 ，ping 报 文 或 DNS 请 求 ) 。 
这 种 方法 的 一 个 缺点 是 许多 LDNS 被 配置 为 不 会 响应 这 些 探测 。 


2.6.4 学 习 案 例 : Netflix, YouTube 和 “看 看 ” 
通过 观察 三 个 高 度 成 功 的 大 规模 部 署 Nettlix、YouTube 和 “看 看 ”， 我 们 来 总 结对 流 
式 存储 视频 的 讨论 。 我 们 将 看 到 ， 这 些 系统 采用 的 方法 差异 很 大 ， 但 却 应 用 了 在 本 节 中 讨 


论 的 许多 根本 原则 。 
1. Netflix 


Netflix 在 2015 年 产生 了 37% 的 北美 住宅 IP PHP RRM, 它 已 经 成 为 美国 首届 一 
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指 的 在 线 电影 和 TV 节目 的 服务 提供 商 [ Snadvine 2015 ] 。 如 我 们 下 面 讨论 的 那样 ，Netflix 
视频 分 发 具有 两 个 主要 部 件 : 亚马逊 云 和 它 自 己 的 专用 CDN 基础 设施 。 

Netflix 有 一 个 Web 网 站 来 处 理 若 干 功能 ， 这 些 功能 包括 用 户 注 册 和 登录 、 计 费 、 用 于 
浏览 和 搜索 的 电影 目录 以 及 一 个 电影 推荐 系统 。 如 图 2-25 所 示 ， 这 个 Web 网 站 (URE 
关联 的 后 端 数据 库 ) 完全 运行 在 亚马逊 云 中 的 亚马逊 服务 器 上 。 此 外 ， 亚 马 逊 云 处 理 下 列 
关键 功能 : 

© 内 容 摄取 。 在 Netflix 能 够 向 它 的 用 户 分 发 某 电 影 之 前 ， 它 必须 首先 获取 和 处 理 该 

电影 。Netflix 接收 制 片 厂 电影 的 母 带 ， 并 且 将 其 上 载 到 亚马逊 云 的 主机 上 。 

e 内 容 处 理 。 亚 马 逊 云 中 的 机 器 为 每 部 电影 生成 许多 不 同 格式 ， 以 适合 在 桌面 计算 

机 、 智 能 手机 和 与 电视 机 相连 的 游戏 机 上 运行 的 不 同类 型 的 客户 视频 播放 器 。 为 
每 种 格式 和 比特 率 都 生成 一 种 不 同 的 版 本 ， 人 允许 使 用 DASH 经 HTTP 适应 性 播 
放流 。 

e 向 其 CDN 上 载 版 本 。 一旦 某 电影 的 所 有 版 本 均 已 生成 ， 在 亚马逊 云 中 的 主机 向 其 


CDN 上 载 这 些 版 本 。 
| i + a M | | | 向 CDN 上 载 
oA w 
J | 
vy -_ \ lite, Mie a 


vd 


af CDN % CDN 
视频 坎 服务 器 服务 器 


er ) 


客户 
图 2-25 Netflix 视频 流 平台 


当 Netflix F 2007 年 首次 推出 它 的 视频 流 式 服务 时 ， 它 雇佣 了 3 个 第 三 方 CDN 公司 来 
分 发 它 的 视频 内 容 。 自 那 时 起 ，Netflix 创建 了 自己 专用 的 CDN， 现 在 它 从 这 些 专用 CDN 
发 送 它 所 有 的 视频 。( 然 而 ，Netflix 仍 使 用 Akamai 来 分 发 它 的 Web 网 页 。) 为 了 创建 它 自 
己 的 CDN, Netflix 在 IXP 和 它们 自己 的 住宅 ISP 中 安装 了 服务 器 机 架 。Netflix 当前 在 超过 
50 个 IXP 位 置 具 有 服务 器 机 架 ; 存放 Netflix 机 架 的 IXP 清单 可 参见 [Netflix Open Connect 
2016 ] 。 也 有 数 百 个 ISP 位 置 存放 Netflix 机 架 ， 同 样 可 参见 [Netflix Open Connect 2016 ] , 
其 中 Netflix 向 潜在 的 ISP 合作 伙伴 提供 了 在 其 网 络 中 安装 一 个 (免费 ) Netflix 机 架 的 操作 
指南 。 在 机 架 中 每 台 服 务 器 具有 几 个 10Gbps 以 太 网 端口 和 超过 100TB 的 存储 。 在 一 个 机 
架 中 服务 器 的 数量 是 变化 的 : IXP 安装 通常 有 数 十 台 服 务 器 并 包含 整个 Netflix 流 式 视频 库 
(包括 多 个 版 本 的 视频 以 支持 DASH); 本 地 IXP 也 许 仅 有 一 台 服 务 器 并 仅 包 含 最 为 流行 的 
视频 。Netflix 不 使 用 拉 高 速 缓存 (2.2.5 节 ) 以 在 IXP 和 ISP 中 扩充 它 的 CDN 服务 器 ， 反 
而 在 非 高 峰 时 段 通过 推 将 这 些 视频 分 发 给 它 的 CDN 服务 器 。 对 于 不 能 保存 整个 库 的 那些 
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fi, Netflix 仅 推送 最 为 流行 的 视频 ， 视 频 的 流行 度 是 基于 逐 天 的 数据 来 决定 的 。 在 You- 
Tube 视频 ( [Netflix Video 1] 和 [Netflix Video 2]) 中 更 为 详细 地 描述 了 Netflix CDN 
Bit. 

描述 了 Netllix 体系 结构 的 组 件 后 ， 我 们 来 更 为 仔细 地 看 一 下 客户 与 各 台 服 务 器 之 
间 的 交互 ， 这 些 服务 器 与 电影 交付 有 关 。 如 前 面 指出 的 那样 ， 浏 览 Netflix 视频 库 的 
Web 网 页 由 亚马逊 云 中 的 服务 器 提供 服务 。 当 用 户 选择 一 个 电影 准备 播放 时 ， 运 行 在 
亚马逊 云 中 的 Netflix 软件 首先 确定 它 的 哪个 CDN 服务 器 具有 该 电影 的 拷贝 。 在 具有 
拷贝 的 服务 器 中 ， 该 软件 决定 客户 请 求 的 “最 好 的 ”服务 器 。 如 果 该 客户 正在 使 用 
一 个 住宅 ISP， 它 具有 安装 在 该 ISP 中 Netflix CDN 服务 器 机 架 并 且 该 机 架 具 有 所 请 求 
电影 的 拷贝 ， 则 通常 选择 这 个 机 架 中 的 一 台 服 务 器 。 倘 若 不 是 ， 通 常 选择 邻近 IXP 的 
一 台 服 务 器 。 

— E Netflix 确定 了 交付 内 容 的 CDN 服务 器 ， 它 向 该 客户 发 送 特定 服务 器 的 IP 地 址 以 
及 资源 配置 文件 ， 该 文件 具有 所 请 求 电影 的 不 同 版 本 的 URL, HRP MARA CDN 服务 器 
则 使 用 专用 版 本 的 DASH 进行 交互 。 具 体 而 言 ， 如 2.6.2 节 所 述 ， 该 客户 使 用 HTTP GET 
请 求 报 文中 的 字 节 范围 首部 ， 以 请 求 来 自 电影 的 不 同 版 本 的 块 。Netflix 使 用 大 约 4 秒 长 的 
块 [Adhikari 2012 ] 。 随 着 这 些 块 的 下 载 ， 客 户 测量 收 到 的 吞吐 量 并 且 运 行 一 个 速率 确定 
算法 来 确定 下 一 个 要 请 求 块 的 质量 。 

Netflix 包含 了 本 节 前 面 讨论 的 许多 关键 原则 ， 包 括 适 应 性 流 和 CDN 分 发 。 然 而 ， 因 
为 Netflix 使 用 自己 专用 的 CDN ， 而 它 仅 分 发 视频 (而 非 Web 网 页 ) ATLA Netflix 已 经 能 够 
简化 并 定制 其 CDN 设计 。 特 别 是 ，Netflix 不 需要 用 如 2.6.3 节 中 所 讨论 的 DNS 重 定向 来 
将 特殊 的 客户 连接 到 一 台 CDN 服务 器 ; 相反 ，Netflix 软件 〈 运 行 在 亚马逊 云 中 ) 直接 告 
知 该 客户 使 用 一 台 特定 的 CDN 服务 器 。 此 外 ，Netflix CDN 使 用 推 高 速 缓 存 而 不 是 拉 高 速 
缓存 (2.2.5 节 ) : 内 容 在 非 高 峰 时 段 的 预定 时 间 被 推 人 服务 器 ， 而 不 是 在 高 速 缓存 未 命 
中 时 动态 地 被 推 和 人。 

2. YouTube 


YouTube 具有 每 分 钟 300 小 时 的 视频 上 载 和 每 天 几 十 亿 次 观看 [YouTube 2016] ， 训 无 
疑问 YouTube 是 世界 上 最 大 的 视频 共享 站 点 。YouTube 于 2005 年 4 月 开始 它 的 服务 ， 并 于 
2006 年 11 月 被 谷歌 公司 收购 。 尽 管 谷歌 /YouTube 设计 和 协议 是 专用 的 ， 但 通过 几 个 独立 
的 测量 结果 ， 我 们 能 够 基本 理解 YouTube 的 工作 原理 [Zink 2009; Torres 2011; Adhikari 
2011a]。 与 Netflix 一 样 ，YouTube 广泛 地 利用 CDN 技术 来 分 发 它 的 视频 [Torres 2011 ] 。 
类 似 于 Netfix， 谷 歌 使 用 其 专用 CDN 来 分 发 YouTube 视频 ， 并 且 已 经 在 几 百 个 不 同 的 IXP 
和 ISP 位 置 安装 了 服务 器 集群 。 从 这 些 位 置 以 及 从 它 的 巨大 数据 中 心 ， 谷 歌 分 发 YouTube 
视频 [Adhikari 2011a]。 然 而 ， 与 Netflix 不 同 ， 谷 歌 使 用 如 2. 2.5 节 中 描述 的 拉 高 速 缓存 
和 如 2. 6. 3 节 中 描述 的 DNS 重 定向 。 在 大 部 分 时 间 ， 谷 歌 的 集群 选择 策略 将 客户 定向 到 某 
个 集群 ， 使 得 客户 与 集群 之 间 的 RTT 是 最 低 的 。 然 而 ， 为 了 平衡 流 经 集群 的 负载 ， 有 时 客 
户 被 定向 (经 DNS) 到 一 个 更 远 的 集群 [Torres 2011], 

YouTube 应 用 HTTP 流 ， 经 常 使 少量 的 不 同 版 本 为 一 个 视频 可 用 ， 每 个 具有 不 同 的 比 
特 率 和 对 应 的 质量 等 级 。YouTube 没有 应 用 适应 性 流 〈 例 如 DASH) ， 而 要 求 用 户 人 工 选择 
一 个 版 本 。 为 了 节省 那些 将 被 重 定位 或 提前 终止 而 浪费 的 带宽 和 服务 器 资源 ，YouTube 在 
获取 视频 的 目标 量 之 后 ， 使 用 HTTP 字 节 范围 请 求 来 限制 传输 的 数据 流 。 
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每 天 有 几 百 万 视频 被 上 载 到 YouTube。 不 仅 YouTube 视频 经 HTTP 以 流 方式 从 服务 
器 到 客户 ， 而 且 YouTube 上 载 者 也 经 HTTP 从 客户 到 服务 器 上 载 他 们 的 视频 。YouTube 
处 理 它 收 到 的 每 个 视频 ， 将 它 转 换 为 YouTube 视频 格式 并 且 创 建 具有 不 同比 特 率 的 多 个 
版 本 。 这 种 处 理 完全 发 生 在 谷歌 数据 中 心 。 (参见 2. 6. 3 节 中 有 关 和 谷歌 的 网 络 基 础 设施 
的 学 习 案 例 。) 

3. 看 看 

我 们 刚 讨论 了 由 专用 CDN 运行 的 专用 服务 器 以 流 的 方式 向 客户 发 送 Netflix 和 YouTube 
视频 。Netflix 和 YouTube 不 仅 必须 为 服务 器 硬件 付费 ， 而 且 要 为 服务 器 分 发 视频 时 使 用 的 
带宽 付费 。 考 虑 到 这 些 服务 的 规模 和 它们 消耗 的 带宽 量 ， 这 种 CDN 部 署 的 代价 可 能 是 很 
高 的 。 

我 们 通过 描述 一 种 完全 不 同 的 方法 来 对 本 节 进 行 总 结 ， 即 经 因特网 大 规模 地 按 需 提供 
视频 。 这 是 一 种 允许 服务 提供 商 极 大 地 减少 其 基础 设施 和 带宽 成 本 的 方法 。 如 你 可 能 猜测 
的 那样 ， 这 种 方法 使 用 P2P 交付 而 不 是 客户 - 服务 器 交付 。 自 2011 年 以 来 ， 看 看 (HM 
雷公 司 拥 有 并 运行 ) 部 署 的 P2P 视频 交付 取得 了 巨大 的 成 功 ， 每 个 月 都 有 数 千 万 用 户 
[Zhang 2015 | 。 

从 高 层面 看 ，P2P 流 式 视频 非常 类 似 于 BitTorrent 文件 下 载 。 当 一 个 对 等 方 要 看 一 
个 视频 时 ， 它 联系 一 个 跟踪 器 ， 以 发 现在 系统 中 具有 该 视频 副本 的 其 他 对 等 方 。 这 个 请 
求 的 对 等 方 则 并 行 地 从 具有 该 文件 的 其 他 对 等 方 请 求 该 视频 的 块 。 然 而 ， 不 同 于 使 用 
BitTorrent 下 载 ， 请 求 被 优先 地 给 予 那 些 即 将 播放 的 块 ， 以 确保 连续 播放 [ Dhungel 
2012]. 

看 看 近期 已 经 向 混合 CDN-P2P 流 式 系统 迁移 [Zhang 2015 ] 。 特 别 是 ， 看 看 目前 在 中 
国 部 署 了 数 以 百 计 的 服务 器 并 且 将 视频 内 容 推 向 这 些 服务 器 。 这 个 看 看 CDN 在 流 式 视 频 
的 启动 阶段 起 着 主要 作用 。 在 大 多 数 场合 ， 客 户 请 求 来 自 CDN 服务 器 的 内 容 的 开头 部 分 ， 
并 且 并 行 地 从 对 等 方 请 求 内 容 。 当 P2P 总 流量 满足 视频 播放 时 ， 该 客户 将 从 CDN 停止 流 
并 仅 从 对 等 方 获得 流 。 但 如 果 P2P 流 的 流量 不 充分 ， 该 客户 重新 启动 CDN 连接 并 且 返 回 
到 混合 CDN-P2P 流 模 式 。 以 这 种 方式 ， 看 看 能 够 确保 短 启动 时 延 ， 与 此 同时 最 小 地 依赖 
成 本 高 的 基础 设施 服务 器 和 带宽 。 


2.7 ERFAR: 生成 网 络 应 用 


我 们 已 经 看 到 了 一 些 重要 的 网 络 应 用 ， 下 面 探讨 一 下 网 络 应 用 程序 是 如 何 实际 编写 
的 。 在 2. 1 节 讲 过 ， 典 型 的 网 络 应 用 是 由 一 对 程序 ( 即 客户 程序 和 服务 器 程序 ) 组 成 的 ， 
它们 位 于 两 个 不 同 的 端 系统 中 。 当 运行 这 两 个 程序 时 ， 创 建 了 一 个 客户 进程 和 一 个 服务 器 
进程 ， 同 时 它们 通过 从 套 接 字 读 出 和 写 入 数据 在 彼此 之 间 进 行 通信 。 开 发 者 创建 一 个 网 络 
应 用 时 ， 其 主要 任务 就 是 编写 客户 程序 和 服务 器 程序 的 代码 。 

网 络 应 用 程序 有 两 类 。 一 类 是 由 协议 标准 (如 一 个 RFC 或 某 种 其 他 标准 文档 ) 中 所 
定义 的 操作 的 实现 ; 这 样 的 应 用 程序 有 时 称 为 “开放 ”的 ， 因 为 定义 其 操作 的 这 些 规 则 为 
人 们 所 共 知 。 对 于 这 样 的 实现 ， 客 户 程 序 和 服务 器 程序 必须 遵守 由 该 RFC 所 规定 的 规则 。 
例如 ， 某 客户 程序 可 能 是 HTTP 协议 客户 端的 一 种 实现 ， 如 在 2.2 节 所 描述 ， 该 协议 由 
RFC 2616 明确 定义 ; 类 似 地 ， 其 服务 器 程序 能 够 是 HTTP 服务 器 协议 的 一 种 实现 ， 也 由 
RFC 2616 明确 定义 。 如 果 一 个 开发 者 编写 客户 程序 的 代码 ， 另 一 个 开发 者 编写 服务 器 程 
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序 的 代码 ， 并且 两 者 都 完全 遵从 该 REC 的 各 种 规则 ,那么 这 两 个 程序 将 能 够 交互 操作 。 
实际 上 ， 今 天 许多 网 络 应 用 程序 涉及 客户 和 服务 器 程序 间 的 通信 ， 这 些 程序 都 是 由 独立 的 
程序 员 开 发 的 。 例 如 ， 谷 歌 Chrome 浏览 器 与 Apache Web 服务 器 通信 ，BitTorrent 客户 与 
BitTorrent 跟踪 器 通信 。 

另 一 类 网 络 应 用 程序 是 专用 的 网 络 应 用 程序 。 在 这 种 情况 下 ， 由 客户 和 服务 器 程序 应 
用 的 应 用 层 协 议 没 有 公开 发 布 在 某 RFC 中 或 其 他 地 方 。 某 单独 的 开发 者 (或 开发 团队 ) 
产生 了 客户 和 服务 器 程序 ， 并 且 该 开发 者 用 他 的 代码 完全 控制 该 代码 的 功能 。 但 是 因为 这 
些 代 码 并 没有 实现 一 个 开放 的 协议 ， 其 他 独立 的 开发 者 将 不 能 开发 出 和 该 应 用 程序 交互 的 
代码 。 

在 本 节 中 ,我们 将 考察 研发 一 个 客户 - 服务 器 应 用 程序 中 的 关键 问题 ， 我 们 将 “ 亲 
力 亲 为 ”来 实现 一 个 非常 简单 的 客户 - 服务 器 应 用 程序 代码 。 在 研发 阶段 ， 开 发 者 必须 
最 先 做 的 一 个 决定 是 ， 应 用 程序 是 运行 在 TCP 上 还 是 运行 在 UDP 上 。 前 面 讲 过 TCP 是 
面向 连接 的 ， 并 且 为 两 个 端 系统 之 间 的 数据 流动 提供 可 靠 的 字 节 流通 道 。UDP 是 无 连接 
的 ， 从 一 个 端 系统 向 男 一 个 端 系 统 发 送 独 立 的 数据 分 组 ， 不 对 交付 提供 任何 保证 。 前 面 
也 讲 过 当 客 户 或 服务 器 程序 实现 了 一 个 由 某 RFC 定义 的 协议 时 ， 它 应 当 使 用 与 该 协议 
关联 的 周知 端口 号 ; 与 之 相反 ， 当 研发 一 个 专用 应 用 程序 时 ， 研 发 者 必须 注意 避免 使 用 
这 些 周知 端口 号 。 (端口 号 已 在 2.1 节 简要 讨论 过 。 它们 将 在 第 3 章 中 更 为 详细 地 
WR.) 

我 们 通过 一 个 简单 的 UDP 应 用 程序 和 一 个 简单 的 TCP 应 用 程序 来 介绍 UDP 和 TCP & 
接 字 编程 。 我 们 用 Python 3 来 呈现 这 些 简单 的 TCP 和 UDP 程序 。 也 可 以 用 Java, C 或 
C ++ 来 编写 这 些 程序 ， 而 我 们 选择 用 Python 最 主要 原因 是 Python 清楚 地 揭示 了 关键 的 套 
接 字 概念 。 使 用 Python ， 代 码 的 行 数 更 少 ， 并 且 向 新 编程 人 员 解 释 每 一 行 代 码 不 会 有 困 
难 。 如 果 你 不 熟悉 Python ， 也 用 不 着 担心 ， 只 要 你 有 过 一 些 用 Java、C 或 C ++ 编程 的 经 
验 ， 就 应 该 很 容易 看 懂 下 面 的 代码 。 

”如 果 读 者 对 用 Java 进行 客户 - 服务 器 编程 感 兴趣 ， 建 议 你 去 查看 与 本 书 配套 的 Web 
网 站 。 事 实 上 ， 能 够 在 那里 找到 用 Java 编写 的 本 节 中 的 所 有 例子 (和 相关 的 实验 )。 如 
果 读 者 对 用 C 进行 客户 - 服务 器 编程 感 兴趣 ， 有 一 些 优秀 参考 资料 可 供 使 用 [ Donahoo 
2001; Stevens 1997; Frost 1994; Kurose 1996 ] 。 我 们 下 面 的 Python 例子 具有 类 似 于 C 
的 外 观 和 感觉 。 


2.7.1 UDP 套 接 字 编程 


在 本 小 节 中 ， 我 们 将 编写 使 用 UDP 的 简单 客户 - 服务 器 程序 ; 在 下 一 小 节 中 ,我 们 
将 编写 使 用 TCP 的 简单 程序 。 

2. 1 节 讲 过 ， 运 行 在 不 同 机 器 上 的 进程 彼此 通过 向 套 接 字 发 送 报 文 来 进行 通信 。 我 们 
说 过 每 个 进程 好 比 是 一 座 房子 ， 该 进程 的 套 接 字 则 好 比 是 一 扇 门 。 应 用 程序 位 于 房子 中 门 
的 一 侧 ;运输 层 位 于 该 门 朝 外 的 另 一 侧 。 应 用 程序 开发 者 在 套 接 字 的 应 用 层 一 侧 可 以 控制 
所 有 东西 ; 然而 ， 它 几乎 无 法 控制 运输 层 一 侧 。 

现在 我 们 仔细 观察 使 用 UDP 套 接 字 的 两 个 通信 进程 之 间 的 交互 。 在 发 送 进程 能 够 将 
数据 分 组 推出 套 接 字 之 门 之 前 ， 当 使 用 UDP 时 ， 必 须 先 将 目的 地 址 附 在 该 分 组 之 上 。 在 
该 分 组 传 过 发 送 方 的 套 接 字 之 后 ， 因 特 网 将 使 用 该 目的 地 址 通过 因特网 为 该 分 组 选 路 到 接 
收 进程 的 套 接 字 。 当 分 组 到 达 接 收 套 接 字 时 ， 接 收 进程 将 通过 该 套 接 字 取 回 分 组 ， 然 后 检 


106 #2# 


查分 组 的 内 容 并 采取 适当 的 动作 。 

因此 你 可 能 现在 想 知道 ， 附 在 分 组 上 的 目的 地 址 包含 了 什么 ? 如 你 所 期 待 的 那样 ， 目 
的 主机 的 IP 地 址 是 目的 地 址 的 一 部 分 。 通 过 在 分 组 中 包括 目的 地 的 IP 地 址 ， 因 特 网 中 的 
路 由 器 将 能 够 通过 因特网 将 分 组 选 路 到 目的 主机 。 但 是 因为 一 台 主 机 可 能 运行 许多 网 络 应 
用 进程 ， 每 个 进程 具有 一 个 或 多 个 套 接 字 ， 所 以 在 目的 主机 指定 特定 的 套 接 字 也 是 必要 
- 的 。 当 生成 一 个 套 接 字 时 ， 就 为 它 分 配 一 个 称 为 端口 号 (port number) 的 标识 符 。 因 此 ， 
如 你 所 期 待 的 ， 分 组 的 目的 地 址 也 包括 该 套 接 字 的 端口 号 。 总 的 来 说 ， 发 送 进程 为 分 组 附 
上 目的 地 址 ， 该 目的 地 址 是 由 目的 主机 的 IP 地 址 和 目的 地 套 接 字 的 端口 号 组 成 的 。 此 外 ， 
如 我 们 很 快 将 看 到 的 那样 ， 发 送 方 的 源 地 址 也 是 由 源 主 机 的 IP 地 址 和 源 套 接 字 的 端口 号 
组 成 ， 该 源 地 址 也 要 附 在 分 组 之 上 。 然 而 ， 将 源 地 址 附 在 分 组 之 上 通常 并 不 是 由 UDP 应 
用 程序 代码 所 为 ， 而 是 由 底层 操作 系统 自动 完成 的 。 

我 们 将 使 用 下 列 简单 的 客户 -服务 器 应 用 程序 来 演示 对 于 UDP 和 TCP 的 套 接 字 编 程 : 

1) 客户 从 其 键盘 读 取 一 行 字 符 (数据 ) 并 将 该 数据 向 服务 器 发 送 。 

2) 服务 器 接收 该 数据 并 将 这 些 字符 转换 为 大 写 。 

3) 服务 器 将 修改 的 数据 发 送 给 客户 。 

4) 客户 接收 修改 的 数据 并 在 其 监视 器 上 将 该 行 显示 出 来 。 

图 2-26 着 重 显示 了 客户 和 服务 器 的 主要 与 套 接 字 相关 的 活动 ， 两 者 通过 UDP 运输 服 
务 进行 通信 。 


服务 器 
(在 serverIP 上 运行 ) 客户 





2-26 使 用 UDP 的 客户 -服务 器 应 用 程序 


现在 我 们 自己 动手 来 查看 用 UDP 实现 这 个 简单 应 用 程序 的 一 对 客户 - 服务 器 程序 。 
我 们 在 每 个 程序 后 也 提供 一 个 详细 、 逐 行 的 分 析 。 我 们 将 以 UDP 客户 开始 ， 该 程序 将 向 
服务 器 发 送 一 个 简单 的 应 用 级 报 文 。 服 务 器 为 了 能 够 接收 并 回答 该 客户 的 报 文 ， 它 必须 准 
备 好 并 已 经 在 运行 ， 这 就 是 说 ， 在 客户 发 送 其 报 文 之 前 ， 服 务 器 必须 作为 一 个 进程 正在 


运行 。 
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客户 程序 被 称 为 UDPClient py， 服 务 器 程序 被 称 为 UDPServer py。 为 了 强调 关键 问 
题 ， 我 们 有 意 提供 最 少 的 代码 。“ 好 代码 ”无 疑 将 具有 更 多 辅助 性 的 代码 行 ， 特 别 是 用 
于 处 理 出 现 差错 的 情况 。 对 于 本 应 用 程序 ， 我 们 任意 选择 了 12000 作为 服务 器 的 端 
口号 。 

1. UDPClient. py 


下 面 是 该 应 用 程序 客户 端的 代码 : 


from socket import * 

serverName = ‘hostname’ 

serverPort = 12000 

clientSocket = socket(AF_INET, SOCK_DGRAM) 

message = raw_input(’Input lowercase sentence:’) 
clientSocket.sendto (message.encode(), (serverName, serverPort) ) 
modifiedMessage, serverAddress = clientSocket.recvfrom (2048) 
print (modifiedMessage.decode () ) 

clientSocket.close() 


现在 我 们 看 在 UDPClient. py 中 的 各 行 代码 。 


from socket import * 


& socket 模块 形成 了 在 Python 中 所 有 网 络 通信 的 基础 。 包 括 了 这 行 ， 我 们 将 能 够 在 程 
序 中 创建 套 接 字 。 


serverName 
serverPort 


第 一 行将 变量 serverName 置 为 字符 串 “hostname”。 这 里 ， 我 们 提供 了 或 者 包含 服务 
ARAJ IP Hohe (如 “128. 138. 32. 126”) 或 者 包含 服务 器 的 主机 名 (如 “cis. poly. edu”) 的 
字符 串 。 如 果 我 们 使 用 主机 名 ， 则 将 自动 执行 DNS lookup 从 而 得 到 IP 地 址 。 第 二 行将 整 
数 变量 serverPort 置 为 12000。 


clientSocket = socket (AF_INET, SOCK_DGRAM) 


该 行 创建 了 客户 的 套 接 字 ， 称 为 clientSocket。 第 一 个 参数 指示 了 地 址 簇 ; 特别 是 ， 
AF_INET 指示 了 底层 网 络 使 用 了 IPv4。 (此 时 不 必 担 心 ， 我 们 将 在 第 4 章 中 讨论 Pv4。) 
第 二 个 参数 指示 了 该 套 接 字 是 SOCK_DGRAM 类 型 的 ， 这 意味 着 它 是 一 个 UDP 套 接 字 (而 
不 是 一 个 TCP 套 接 字 ) 。 值 得 注意 的 是 ， 当 创建 套 接 字 时 ， 我 们 并 没有 指定 客户 套 接 字 的 
端口 号 ; 相反， 我 们 让 操作 系统 为 我 们 做 这 件 事 。 既 然 已 经 创建 了 客户 进程 的 门 ， 我 们 将 
要 生成 通过 该 门 发 送 的 报 文 。 


message = raw_input(’Input lowercase sentence:’ ) 


raw_input() 是 Python 中 的 内 置 功能 。 当 执行 这 条 命令 时 ， 客 户 上 的 用 户 将 以 单词 
“Input lowercase sentence:” 进行 提示 ， 用 户 则 使 用 她 的 键盘 输入 一 行 ， 该 内 容 被 放 和 人 变量 
message 中 。 既 然 我 们 有 了 一 个 套 接 字 和 一 条 报 文 ， 我 们 将 要 通过 该 套 接 字 向 目的 主机 发 
送 报 文 。 

clientSocket.sendto(message.encode(), (serverName, serverPort) ) 

在 上 述 这 行 中 ， 我 们 首先 将 报 文 由 字符 串 类 型 转换 为 字 节 类 型 ， 因 为 我 们 需要 向 套 
接 字 中 发 送 字 节 ; 这 将 使 用 encode() 方 法 完成 。 方 法 sendto() 为 报 文 附 上 目的 地 址 
( serverName ，serverPort) 并 且 向 进程 的 套 接 字 clientSocket 发 送 结果 分 组 。 (如 前 面 所 
述 ， 源 地 址 也 附 到 分 组 上 ， 尽 管 这 是 自动 完成 的 ， 而 不 是 显 式 地 由 代码 完成 的 。) 经 一 


‘hostname’ 
12000 
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个 UDP 套 接 字 发 送 一 个 客户 到 服务 器 的 报 文 非常 简单 ! 在 发 送 分 组 之 后 ， 客 户 等 待 接 
收 来 自 服务 器 的 数据 。 


modifiedMessage, serverAddress = clientSocket.recvfrom (2048) 


对 于 上 述 这 行 ， 当 一 个 来 自 因特网 的 分 组 到 达 该 客户 套 接 字 时 ， 该 分 组 的 数据 被 放 
置 到 变量 modifiedMessage 中 ， 其 源 地 址 被 放置 到 变量 serverAddress 中 。 变 量 serverAd- 
dress 包含 了 服务 器 的 耳 地 址 和 服务 器 的 端口 号 。 程 序 UDPClient 实际 上 并 不 需要 服务 器 
的 地 址 信息 ， 因 为 它 从 起 始 就 已 经 知道 了 该 服务 器 地 址 ; 而 这 行 Python 代码 仍然 提供 了 
服务 器 的 地 址 。 方 法 recvfrom 也 取 缓 存 长 度 2048 作为 输入 。 (该 缓存 长 度 用 于 多 种 
目的 。) 


print (modifiedMessage.decode () ) 


这 行将 报 文 从 字 节 转化 为 字符 串 后 ， 在 用 户 显示 器 上 打印 出 modifiedMessage。 它 应 当 
是 用 户 键入 的 原始 行 ， 但 现在 变 为 大 写 的 了 。 


clientSocket.close() 


该 行 关闭 了 套 接 字 。 然 后 关闭 了 该 进程 。 
2. UDPServer. py 


现在 来 看 看 这 个 应 用 程序 的 服务 器 端 : 


from socket import * 

serverPort = 12000 

serverSocket = socket(AF_INET, SOCK_DGRAM) 
serverSocket.bind((’’, serverPort) ) 
print(”The server is ready to receive”) 
while True: 


message, clientAddress = serverSocket.recvfrom(2048) 
modifiedMessage = message.decode() .upper() 
serverSocket.sendto (modifiedMessage.encode(), clientAddress) 


注意 到 UDPServer 的 开始 部 分 与 UDPClient 类 似 。 它 也 是 导入 套 接 字模 块 ， 也 将 整数 
变量 serverPort 设置 为 12000， 并 且 也 创建 套 接 字 类 型 SOCK_DGRAM (一 种 UDP 套 接 字 ) 。 
与 UDPClient 有 很 大 不 同 的 第 一 行 代 码 是 : 


serverSocket.bind((’’, serverPort)) 


上 面 行将 端口 号 12000 与 该 服务 器 的 套 接 字 绑 定 〈 即 分 配 ) 在 一 起 。 因 此 在 UDPServ- 
er 中 ，( 由 应 用 程序 开发 者 编写 的 ) 代码 显 式 地 为 该 套 接 字 分 配 一 个 端口 号 。 以 这 种 方式 ， 
当 任 何人 向 位 于 该 服务 器 的 IP 地 址 的 端口 12000 发 送 一 个 分 组 ， 该 分 组 将 导向 该 套 接 字 。 
UDPServer 然后 进入 一 个 while 循环 ; 该 while 循环 将 允许 UDPServer 无 限期 地 接收 并 处 理 
来 自 客户 的 分 组 。 在 该 while 循环 中 ，UDPServer 等 待 一 个 分 组 的 到 达 。 


message, clientAddress = serverSocket.recvfrom(2048) 


这 行 代码 类 似 于 我 们 在 UDPClient 中 看 到 的 。 当 某 分 组 到 达 该 服务 器 的 套 接 字 时 ， 该 
分 组 的 数据 被 放置 到 变量 message 中 ， 其 源 地 址 被 放置 到 变量 clientAddress 中 。 变 量 clien- 
tAddress 包含 了 客户 的 卫 地 址 和 客户 的 端口 号 。 这 里 ，UDPServer 将 利用 该 地 址 信息 ， 因 
为 它 提 供 了 返回 地 址 ， 类 似 于 普通 邮政 邮件 的 返回 地 址 。 使 用 该 源 地 址 信息 ， 服 务 器 此 时 
知道 了 它 应 当 将 回答 发 向 何 处 。 


modifiedMessage = message.decode() .upper () 
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此 行 是 这 个 简单 应 用 程序 的 关键 部 分 。 它 在 将 报 文 转化 为 字符 串 后 ， 获 取 由 客户 发 送 
的 行 并 使 用 方法 upper() 将 其 转换 为 大 写 。 


serverSocket.sendto (modifiedMessage.encode(), clientAddress) 


最 后 一 行将 该 客户 的 地 址 CIP 地 址 和 端口 号 ) 附 到 大 写 的 报 文 上 (在 将 字符 串 转化 
为 字 节 后 ) ， 并 将 所 得 的 分 组 发 送 到 服务 器 的 套 接 字 中 。( 如 前 面 所 述 ， 服 务 器 地 址 也 附 在 
分 组 上 ， 尽 管 这 是 自动 而 不 是 显 式 地 由 代码 完成 的 。) 然后 因特网 将 分 组 交付 到 该 客户 地 
址 。 在 服务 器 发 送 该 分 组 后 ， 它 仍 维持 在 while 循环 中 ,等待 (从 运行 在 任 一 台 主 机 上 的 
任何 客户 发 送 的 ) 另 一 个 UDP 分 组 到 达 。 

为 了 测试 这 对 程序 ， 可 在 一 台 主 机 上 运行 UDPClient py， 并 在 另 一 台 主 机 上 运行 
UDPServer py。 保 证 在 UDPClient. py 中 包括 适当 的 服务 器 主机 名 或 耳 地 址 。 接 下 来 ,在 
服务 器 主机 上 执行 编译 的 服务 器 程序 UDPServer. py。 这 在 服务 器 上 创建 了 一 个 进程 ， 等 
待 着 某 个 客户 与 之 联系 。 然 后 ， 在 客户 主机 上 执行 编译 的 客户 器 程序 UDPClient. py。 这 
在 客户 上 创建 了 一 个 进程 。 最 后 ， 在 客户 上 使 用 应 用 程序 ， 键入 一 个 句子 并 以 回 车 
结束 。 

可 以 通过 稍 加 修改 上 述 客 户 和 服务 器 程序 来 研制 自己 的 UDP 客户 - 服务 器 程序 。 
例如 ， 不 必 将 所 有 字母 转换 为 大 写 ， 服 务 器 可 以 计算 字母 s 出 现 的 次 数 并 返回 该 数字 。 
或 者 能 够 修改 客户 程序 ， 使 其 在 收 到 一 个 大 写 的 句子 后 ， 用 户 能 够 向 服务 器 继续 发 送 更 
多 的 句子 。 


2.7.2 TCP 套 接 字 编 程 


与 UDP Ale], TCP 是 一 个 面向 连接 的 协议 。 这 意味 着 在 客户 和 服务 器 能 够 开始 互相 
发 送 数据 之 前 ， 它 们 先 要 握手 和 创建 一 个 TCP 连接 。TCP 连接 的 一 端 与 客户 套 接 字 相 联 
系 ， 另 一 端 与 服务 器 套 接 字 相 联系 。 当 创建 该 TCP 连接 时 ， 我 们 将 其 与 客户 套 接 字 地 址 
CIP 地 址 和 端口 号 ) 和 服务 器 套 接 字 地 址 P 地 址 和 端口 号 ) 关联 起 来 。 使 用 创建 的 TCP 
连接 ， 当 一 侧 要 向 另 一 侧 发 送 数据 时 ， 它 只 需 经 过 其 套 接 字 将 数据 丢 进 TCP 连接 。 这 与 
UDP 不 同 ，UDP 服务 器 在 将 分 组 丢 进 套 接 字 之 前 必须 为 其 附 上 一 个 目的 地 地 址 。 

现在 我 们 仔细 观察 一 下 TCP 中 客户 程序 和 服务 器 程序 的 交互 。 客 户 具 有 向 服务 器 发 起 
接触 的 任务 。 服 务 器 为 了 能 够 对 客户 的 初始 接触 做 出 反应 ， 服 务 器 必须 已 经 准备 好 。 这 意 
味 着 两 件 事 。 第 一 ， 与 在 UDP 中 的 情况 一 样 ，TCP 服务 器 在 客户 试图 发 起 接触 前 必须 作 
为 进程 运行 起 来 。 第 二 ， 服 务 器 程序 必须 具有 一 扇 特殊 的 门 ， 更 精确 地 说 是 一 个 特殊 的 套 
接 字 ， 该 门 欢迎 来 自 运 行 在 任意 主机 上 的 客户 进程 的 某 种 初始 接触 。 使 用 房子 与 门 来 比喻 
进程 与 套 接 字 ， 有 时 我 们 将 客户 的 初始 接触 称 为 “项 欢迎 之 门 ”。 

随 着 服务 器 进程 的 运行 ， 客 户 进程 能 够 向 服务 器 发 起 一 个 TCP 连接 。 这 是 由 客户 程序 
通过 创建 一 个 TCP 套 接 字 完 成 的 。 当 该 客户 生成 其 TO 套 接 字 时 ， 它 指定 了 服务 器 中 的 
欢迎 套 接 字 的 地 址 ， 即 服务 器 主机 的 IP 地址 及 其 套 接 字 的 端口 号 。 生 成 其 套 接 字 后 ， 该 
客户 发 起 了 一 个 三 次 握手 并 创建 与 服务 器 的 一 个 TCP 连接 。 发 生 在 运输 层 的 三 次 握手 ， 对 
于 客户 和 服务 器 程序 是 完全 透明 的 。 

在 三 次 握手 期 间 ， 客 户 进 程 敲 服务 器 进程 的 欢迎 之 门 。 当 该 服务 器 “ 听 ” 到 敲 门 声 
时 ， 它 将 生成 一 扇 新 门 〈 更 精确 地 讲 是 一 个 新 套 接 字 ) ， 它 专门 用 于 特定 的 客户 。 在 我 们 
下 面 的 例子 中 ， 欢 迎 之 门 是 一 个 我 们 称 为 serverSocket 的 TCO 套 接 字 对 象 ; 它 是 专门 对 客 
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户 进行 连接 的 新 生成 的 套 接 字 ， 称 为 连接 套 接 字 (connectionSocket) 。 初 次 遇 到 TCP 套 接 
字 的 学 生 有 时 会 混淆 欢迎 套 接 字 (这 是 所 有 要 与 服务 器 通信 的 客户 的 起 始 接触 点 ) 和 每 个 
新 生成 的 服务 器 侧 的 连接 套 接 字 (这 是 随后 为 与 每 个 客户 通信 而 生成 的 套 接 字 ) 。 


从 应 用 程序 的 观点 来 看 ， 客 户 套 接 
字 和 服务 器 连接 套 接 字 直接 通过 一 根 管 
道 连接 。 如 图 2-27 所 示 ， 客 户 进程 可 
以 向 它 的 套 接 字 发 送 任意 字 节 ， 并 且 
TCP 保证 服务 器 进程 能 够 按 发 送 的 顺序 
接收 (通过 连接 套 接 字 ) 每 个 字 节 。 
TCP 因此 在 客户 和 服务 器 进程 之 间 提 供 
了 可 靠 服务 。 此 外 ， 就 像 人 们 可 以 从 同 
一 鹿 门 进 和 出 一 样 ， 客 户 进程 不 仅 能 向 
它 的 套 接 字 发 送 字 节 ， 也 能 从 中 接收 字 
节 ; 类 似 地 ， 服 务 器 进程 不 仅 从 它 的 连 
接 套 接 字 接收 字 节 ， 也 能 向 其 发 送 
字 节 。 

我 们 使 用 同样 简单 的 客户 - 服务 器 
应 用 程序 来 展示 TCP 套 接 字 编 程 : 客 
户 向 服务 器 发 送 一 行 数据 ， 服 务 器 将 这 





图 2-27 TCPServer 进程 有 两 个 套 接 字 


行 改 为 大 写 并 回 送 给 客户 。 图 2-28 着 重 显示 了 客户 和 服务 器 的 主要 与 套 接 字 相 关 的 活动 ， 


两 者 通过 TCP 运输 服务 进行 通信 。 
服务 器 
(在 serverIP 上 运行 ) 


客户 





图 2-28 使 用 TCP 的 客户 = 服务 器 应 用 程序 
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1. TCPClient. py 
这 里 给 出 了 应 用 程序 客户 端的 代码 : 


from socket import * 

serverName = ‘'servername’ 

serverPort = 12000 

clientSocket = socket (AF_INET, SOCK_STREAM) 
clientSocket.connect ( (serverName, serverPort) ) 
sentence = raw_input(’Input lowercase sentence:’) 
clientSocket.send(sentence.encode () ) 
modifiedSentence = clientSocket.recv (1024) 
print(’From Server: ', modifiedSentence. decode () ) 
clientSocket.close() 


现在 我 们 查看 这 些 代 码 中 与 UDP 实现 有 很 大 差别 的 各 行 。 首 当 其 冲 的 行 是 客户 套 接 
字 的 创建 。 


clientSocket = socket(AF_INET, SOCK_STREAM) 


该 行 创建 了 客户 的 套 接 字 ， 称 为 clientSocket。 第 一 个 参数 仍 指示 底层 网 络 使 用 的 是 
IPv4。 第 二 个 参数 指示 该 套 接 字 是 SOCK_STREAM 类 型 。 这 表明 它 是 一 个 TCP ERF (而 
不 是 一 个 UDP 套 接 字 ) 。 值 得 注意 的 是 当 我 们 创建 该 客户 套 接 字 时 仍 未 指定 其 端口 号 ; 相 
反 ， 我 们 让 操作 系统 为 我 们 做 此 事 。 此 时 的 下 一 行 代码 与 我 们 在 UDPClient 中 看 到 的 极为 
不 同 : 


clientSocket.connect ((serverName,serverPort) ) 


前 面 讲 过 在 客户 能 够 使 用 一 个 TCP 套 接 字 向 服务 器 发 送 数 据 之 前 (反之 亦 然 ) ， 必 须 
在 客户 与 服务 器 之 间 创 建 一 个 TCP 连接。 上 面 这 行 就 发 起 了 客户 和 服务 器 之 间 的 这 条 TCP 
连接 。connect() 方 法 的 参数 是 这 条 连接 中 服务 器 端的 地 址 。 这 行 代码 执行 完 后 ， 执 行 三 次 
握手 ， 并 在 客户 和 服务 器 之 间 创 建 起 一 条 TCP 连接 。 


sentence = raw_input(’Input lowercase sentence:’ ) 


如 同 UDPClient 一 样 ， 上 一 行 从 用 户 获 得 了 一 个 句子 。 字 符 串 sentence 连续 收集 字符 
直到 用 户 键入 回 车 以 终止 该 行为 止 。 代 码 的 下 一 行 也 与 UDPClient 极为 不 同 : 


clientSocket.send(sentence.encode () ) 


上 一 行 通过 该 客户 的 套 接 字 并 进入 TOP 连接 发 送 字符 串 sentence。 值 得 注意 的 是 ， 该 
程序 并 未 显 式 地 创建 一 个 分 组 并 为 该 分 组 附 上 目的 地 址 ， 而 使 用 UDP 套 接 字 却 要 那样 做 。 
相反 ， 该 客户 程序 只 是 将 字符 串 sentence 中 的 字 节 放 人 该 TO 连接 中 去 。 客 户 然后 就 等 待 
接收 来 自 服 务 器 的 字 节 。 


modifiedSentence = clientSocket.recv (2048) 


当 字 符 到 达 服 务 器 时 ， 它 们 被 放置 在 字符 串 modifiedSentence 中 。 字 符 继续 积累 在 


modifiedSentence 中 ， 直 到 该 行 以 回 车 符 结束 为 止 。 在 打印 大 写 句 子 后 ， 我 们 关闭 客户 的 套 
接 字 。 


clientSocket.close() 


最 后 一 行 关闭 了 套 接 字 ， 因 此 关闭 了 客户 和 服务 器 之 间 的 TCP 连接 。 它 引起 客户 中 的 
TCP 向 服务 器 中 的 TCP 发 送 一 条 TCP 报 文 (参见 3.5 节 )。 
2. TCPServer. py 


现在 我 们 看 一 下 服务 器 程序 。 
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from socket import * 

serverPort = 12000 

serverSocket = socket (AF_INET, SOCK_STREAM) 

serverSocket.bind((‘'’,serverPort) ) 

serverSocket. listen (1) 

print(’The server is ready to receive’) 

while True: 
connectionSocket, addr = serverSocket.accept () 
sentence = connectionSocket.recv (1024) .decode () 
capitalizedSentence = sentence.upper () 
connectionSocket.send (capitalizedSentence.encode () ) 
connectionSocket.close() 


现在 我 们 来 看 看 上 述 与 UDPServer 及 TCPClient 有 显著 不 同 的 代码 行 。 与 TCPClient 相 
同 的 是 ， 服 务 器 创建 一 个 TCP 套 接 字 ， 执 行 : 


serverSocket=socket (AF_INET, SOCK_STREAM) 


与 UDPServer 类 似 ， 我 们 将 服务 器 的 端口 号 serverPort 与 该 套 接 字 关 联 起 来 : 


serverSocket.bind((’’,serverPort) ) 


但 对 TCP 而 言 serverSocket 将 是 我 们 的 欢迎 套 接 字 。 在 创建 这 扇 欢 迎 之 门 后 ， 我 们 
将 等 待 并 聆听 某 个 客户 斋 门 : 


ServerSocket.listen(1) 


该 行 让 服务 器 聆听 来 自 客户 的 TCP 连接 请 求 。 其 中 参数 定义 了 请 求 连接 的 最 大 数 
(至 少 为 1)。 


connectionSocket, addr = serverSocket.accept() 


当 客 户 敲 该 门 时 ， 程 序 为 serverSocket 调用 accept() 方 法 ， 这 在 服务 器 中 创建 了 一 个 称 
为 connectionSocket 的 新 套 接 字 ， 由 这 个 特定 的 客户 专用 。 客 户 和 服务 器 则 完成 了 握手 ， 在 
客户 的 clientSocket 和 服务 器 的 serverSocket 之 间 创 建 了 一 个 TCP 连接 。 借 助 于 创建 的 TCP 
连接 ， 客 户 与 服务 器 现在 能 够 通过 该 连接 相互 发 送 字 节 。 使 用 TCP， 从 一 侧 发 送 的 所 有 字 
节 不 仅 确保 到 达 另 一 侧 ， 而 且 确 保 按 序 到 达 。 


connectionSocket.close() 


在 此 程序 中 ， 在 向 客户 发 送 修改 的 句子 后 ， 我 们 关闭 了 该 连接 套 接 字 。 但 由 于 serer- 
Socket 保持 打开 ， 所 以 另 一 个 客户 此 时 能 够 融 门 并 向 该 服务 器 发 送 一 个 句子 要 求 修改 。 

我 们 现在 完成 了 TCP 套 接 字 编 程 的 讨论 。 建 议 你 在 两 台 单独 的 主机 上 运行 这 两 个 程 
序 ， 也 可 以 修改 它们 以 达到 稍微 不 同 的 目的 。 你 应 当 将 前 面 两 个 UDP 程序 与 这 两 个 TCP 
程序 进行 比较 ， 观 察 它 们 的 不 同 之 处 。 你 也 应 当做 在 第 2、4 和 9 章 后 面 描述 的 套 接 字 编 
程 作 业 。 最 后 ， 我 们 希望 在 掌握 了 这 些 和 更 先进 的 套 接 字 程序 后 的 某 天 ， 你 将 能 够 编写 你 
自己 的 流行 网 络 应 用 程序 ， 变 得 非常 富有 和 声名 卓著 ， 并 记得 本 书 的 作者 ! 


2.8 小 结 


在 本 章 中 ， 我 们 学 习 了 网 络 应 用 的 概念 和 实现 两 个 方面 。 我 们 学 习 了 被 因特网 应 用 普 
遍 采 用 的 客户 - 服务 器 模式 ， 并 且 看 到 了 该 模式 在 HTTP、SMTP、POP3 和 DNS 等 协议 中 
的 使 用 。 我 们 已 经 更 为 详细 地 学 习 了 这 些 重要 的 应 用 层 协 议 以 及 与 之 对 应 的 相关 应 用 
(Web、 文 件 传输 、 电 子 邮 件 和 DNS) 。 我 们 也 已 学 习 了 P2P 体系 结构 以 及 它 如 何 应 用 在 许 
多 应 用 程序 中 。 我 们 也 学 习 了 流 式 视频 ， 以 及 现代 视频 分 发 系统 是 如 何 利用 CDN 的 。 对 
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于 面向 连接 的 〈《TCP) 和 无 连接 的 (UDP) 端 到 端 传输 服务 ， 我 们 走马 观 花 般 地 学 习 了 套 
接 字 的 使 用 。 至 此 ， 我 们 在 分 层 的 网 络 体系 结构 中 的 向 下 之 旅 已 经 完成 了 第 一 步 。 

在 本 书 一 开始 的 1. 1 节 中 ， 我 们 对 协议 给 出 了 一 个 相当 含糊 的 框架 性 定义 : “在 两 个 
或 多 个 通信 实体 之 间 交 换 报 文 的 格式 和 次 序 ， 以 及 对 某 报 文 或 其 他 事件 传输 和 /或 接收 所 
采取 的 动作 。 本 章 中 的 内 容 ， 特 别 是 我 们 对 HTTP, SMTP, POP3 和 DNS 协议 进行 的 细 
致 研究 ， 已 经 为 这 个 定义 加 入 了 相当 可 观 的 实质 性 的 内 容 。 协 议 是 网 络 连接 中 的 核心 概 
念 ; 对 应 用 层 协议 的 学 习 ， 为 我 们 提供 了 有 关 协 议 内 涵 的 更 为 直觉 的 认识 。 

在 2.1 节 中 ,我 们 描述 了 TCP 和 UDP 为 调用 它们 的 应 用 提供 的 服务 模型 。 当 我 们 在 
2.7 节 中 开发 运行 在 TCP 和 UDP 之 上 的 简单 应 用 程序 时 ， 我们 对 这 些 服务 模型 进行 了 更 加 
深入 的 观察 。 然 而 ， 我 们 几乎 没有 介绍 TCP 和 UDP 是 如 何 提 供 这 种 服务 模型 的 。 例 如 ， 
我 们 知道 TCP 提供 了 一 种 可 靠 数据 服务 ， 但 我 们 未 说 它 是 如 何 做 到 这 一 点 的 。 在 下 一 章 中 
我 们 将 不 仅 关注 运输 协议 是 什么 ,而 且 还 关注 它 如 何 工作 以 及 为 什么 要 这 人 么 做 。 

有 了 因特网 应 用 程序 结构 和 应 用 层 协议 的 知识 之 后 ， 我 们 现在 准备 继续 沿 该 协议 栈 向 
下 ,在 第 3 章 中 探讨 运输 层 。 


课 后 习题 和 问题 








2.1 节 


RI. 列 出 5 种 非 专用 的 因特网 应 用 及 它们 所 使 用 的 应 用 层 协 议 。 

R2. 网 络 体系 结构 与 应 用 程序 体系 结构 之 间 有 什么 区 别 ? 

R3. 对 两 进程 之 间 的 通信 会 话 而 言 ， 哪 个 进程 是 客户 ， 哪 个 进程 是 服务 器 ? 

R4. 对 一 个 P2P 文件 共享 应 用 ， 你 同意 “一 个 通信 会 话 不 存在 客户 端 和 服务 器 端的 概念 ”的 说 法 吗 ? 为 

- 什么 ? 

RS. 运行 在 一 台 主 机 上 的 一 个 进程 ， 使 用 什么 信息 来 标识 运行 在 另 一 台 主 机 上 的 进程 ? 

R6. 假定 你 想 尽快 地 处 理 从 远程 客户 到 服务 器 的 事务 ， 你 将 使 用 UDP 还 是 TCP? 为 什么 ? 

R7. 参见 图 2-4， 我 们 看 到 在 该 图 中 所 列 出 的 应 用 程序 没有 一 个 同时 既 要 求 无 数据 丢失 又 要 求 定时 的 。 你 
能 设想 一 个 既 要 求 无 数据 丢失 又 高 度 时 间 敏 感 的 应 用 程序 吗 ? 

R8. 列 出 一 个 运输 协议 能 够 提供 的 4 种 宽泛 类 型 的 服务 。 对 于 每 种 服务 类 型 ， 指 出 是 UDP 还 是 TCP (或 
这 两 种 协议 ) 提供 这 样 的 服务 ? 

R9. 前 面 讲 过 TCP 能 用 SSL 来 强化 ， 以 提供 进程 到 进程 的 安全 性 服务 ,包括 加 密 。SSL 运行 在 运输 层 还 
是 应 用 层 ? 如 果 某 应 用 程序 研制 者 想 要 用 SSL 来 强化 UDP， 该 研制 者 应 当做 些 什么 工作 ? 

2.2~2.4 4 

R10. 握手 协议 的 作用 是 什么 ? 

R11. 为 什么 HTTP, SMTP 及 POP3 都 运行 在 TCP， 而 不 是 UDP 上 ? 

R12. 考虑 一 个 电子 商务 网 站 需要 保留 每 一 个 客户 的 购买 记录 。 描 述 如 何 使 用 cookie 来 完成 该 功能 ? 

R13. 描述 Web 缓存 器 是 如 何 减 少 接收 被 请 求 对 象 的 时 延 的 。Web 缓存 器 将 减少 一 个 用 户 请 求 的 所 有 对 
象 或 只 是 其 中 的 某 些 对 象 的 时 延 吗 ? 为 什么 ? 

R14. Telnet 到 一 台 Web 服务 器 并 发 送 一 个 多 行 的 请 求 报 文 。 在 该 请 求 报 文中 包含 下 -modified -since: 首 
部 行 ， 迫 使 响应 报 文中 出 现 “304 Not Modified” 状态 代码 。 

R15. 列 出 几 种 流行 的 即时 通信 应 用 。 它 们 使 用 相同 的 协议 作为 SMS 吗 ? 

R16. 假定 Alice 使 用 一 个 基于 Web 的 电子 邮件 账户 (例如 Hotmail 或 Gmail) 向 Bob 发 报 文 ， 而 Bob 使 用 
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POP3 从 他 的 邮件 服务 器 访问 自己 的 邮件 。 讨 论 该 报 文 是 如 何 从 Alice 主机 到 Bob 主机 的 。 要 列 出 在 
两 台 主 机 间 移 动 该 报 文 时 所 使 用 的 各 种 应 用 层 协议 。 

R17. 将 你 最 近 收 到 的 报 文 首 部 打印 出 来 。 其 中 有 多 少 Received: 首部 行 ? 分 析 该 报 文 的 首部 行 中 的 每 
一 行 。 

R18. 从 用 户 的 观点 看 ，POP3 协议 中 下 载 并 删除 模式 和 下 载 并 保留 模式 有 什么 区 别 吗 ? 

R19. 一 个 机 构 的 Web 服务 器 和 邮件 服务 器 可 以 有 完全 相同 的 主机 名 别名 (例如 ，foo. com) 吗 ? 包含 邮 
件 服务 器 主机 名 的 RR 有 什么 样 的 类 型 ? 

R20. 仔细 检查 收 到 的 电子 邮件 ， 查 找 由 使 用 . edu 电子 邮件 地 址 的 用 户 发 送 的 报 文 首部 。 从 其 首部 ， 能 
够 确定 发 送 该 报 文 的 主机 的 全 地 址 吗 ? 对 于 由 Gmail 账号 发 送 的 报 文 做 相同 的 事 。 

2.5% 

R21. 在 BitTorrent 中 ， 假 定 Alice 向 Bob 提供 一 个 30 秒 间隔 的 文件 块 知 吐 量 。Bob 将 必须 进行 回报 ， 在 相 
同 的 间隔 中 向 Alice 提供 文件 块 吗 ? 为 什么 ? 

R22. 考虑 一 个 新 对 等 方 Alice 加 入 BitTorrent 而 不 拥有 任何 文件 块 。 没 有 任何 块 ， 因 此 她 没有 任何 东西 可 
上 载 ， 她 无 法 成 为 任何 其 他 对 等 方 的 前 4 位 上 载 者 。 那 么 Alice 将 怎样 得 到 她 的 第 一 个 文件 块 呢 ? 

R23. 覆盖 网 络 是 什么 ? 它 包 括 路 由 器 吗 ? 在 覆盖 网 络 中 边 是 什么 ? 

2.6 节 

R24. CDN 通常 采用 两 种 不 同 的 服务 器 放置 方法 之 一 。 列 举 并 简单 描述 它们 。 

R25. 除了 如 时 延 、 丢 包 和 带宽 性 能 等 网 络 相关 的 考虑 外 ， 设 计 一 种 CDN 服务 器 选择 策略 时 还 有 其 他 重 
要 因素 。 它 们 是 什么 ? 

2.7 节 

R26. 2.7 节 中 所 描述 的 UDP 服务 器 仅 需 要 一 个 套 接 字 ， 而 TCP 服务 器 需要 两 个 套 接 字 。 为 什么 ? 如果 
TCP 服务 器 支持 n 个 并 行 连接 ， 每 条 连接 来 自 不 同 的 客户 主机 ， 那 么 TCP 服务 器 将 需要 多 少 个 套 
接 字 ? 

R27. 对 于 2.7 节 所 描述 的 运行 在 TCP 之 上 的 客户 -服务 器 应 用 程序 ， 服 务 器 程序 为 什么 必须 先 于 客户 程序 
运行 ? 对 于 运行 在 UDP 之 上 的 客户 -服务 器 应 用 程序 ， 客 户 程序 为 什么 可 以 先 于 服务 器 程序 运行 ? 





P1. 是 非 判断 题 。 

a. 假设 用 户 请 求 由 一 些 文本 和 3 幅 图 像 组 成 的 Web 页 面 。 对 于 这 个 页 面 ， 客 户 将 发 送 一 个 请 求 报 文 
并 接收 4 个 响应 报 文 。 

b. 两 个 不 同 的 Web 页 面 (例如 ，www. mit. edu/research. html 及 www. mit. edu/students. html) 可 以 通 
过 同一 个 持续 连接 发 送 。 

c. 在 浏览 器 和 初始 服务 器 之 间 使 用 非 持续 连接 的 话 ， 一 个 TCP 报 文 段 是 可 能 携带 两 个 不 同 的 HTTP 
服务 请 求 报 文 的 。 

d. 在 HTTP 响应 报 文中 的 Date: 首部 指出 了 该 响应 中 对 象 最 后 一 次 修改 的 时 间 。 

e. HTTP 响应 报 文 决 不 会 具有 空 的 报 文体 。 

P2. SMS, iMessage 和 WhatsApp 都 是 智能 手机 即时 通信 系统 。 在 因特网 上 进行 一 些 研究 后 ， 为 这 些 系 统 
分 别 写 一 段 它们 所 使 用 协议 的 文字 。 然 后 撰文 解释 它们 的 差异 所 在 。 

P3. 考虑 一 个 要 获取 给 定 URL 的 Web 文档 的 HTTP 客户 。 该 HTTP 服务 器 的 IP 地 址 开始 时 并 不 知道 。 在 
这 种 情况 下 ， 除 了 HTTP 外 ， 还 需要 什么 运输 层 和 应 用 层 协议 ? 

P4. 考虑 当 浏 览 器 发 送 一 个 HTTP GET 报 文 时 ,通过 Wireshark 俘获 到 下 列 ASCH 字符 串 〈 即 这 是 一 个 
HTTP GET 报 文 的 实际 内 容 ) 。 字 符 <cr > <f> 是 回 车 和 换行 符 《〈 即 下 面 文本 中 的 斜体 字符 串 < cr > 
表示 了 单个 回 车 符 ， 该 回 车 符 包含 在 HTTP 首部 中 的 相应 位 置 ) 。 回 答 下 列 间 题 ， 指 出 你 在 下 面 HT 
TP GET 报 文 中 找到 答案 的 地 方 。 
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GET /cs453/index.html HTTP/1.1<cr><lf>Host: gai 
a.cs.umass.edu<cr><lf>User-Agent: Mozilla/5.0 ( 

Windows;U; Windows NT 5.1; en-US; rv:1.7.2) Gec 

ko/20040804 Netscape/7.2 (ax) <cr><lf>Accept:ex 

t/xml, application/xml, application/xhtml+xml, text 

/html;q=0.9, text/plain; q=0.8,image/png, */*;q=0.5 

<cr><lf>Accept-Language: en-us,en;q=0.5<cr><l1f>Accept- 

Encoding: zip,deflate<cr><lf>Accept-Charset: ISO 
-8859-1,utf-8;q=0.7,*;q=0.7<cr><lf>Keep-Alive: 300<cr> 

<lf>Connection: keep-alive<cr><l1f><cr><lf> 

由 浏览 器 请 求 的 文档 的 URL 是 什么 ? 

该 浏览 器 运行 的 是 HTTP 的 何 种 版 本 ? 

该 浏览 器 请 求 的 是 一 条 非 持续 连接 还 是 一 条 持续 连接 ? 

该 浏览 器 所 运行 的 主机 的 IP 地 址 是 什么 ? 

. 发 起 该 报 文 的 浏览 器 的 类 型 是 什么 ? 在 一 个 HTTP 请 求 报 文 中 ， 为 什么 需要 浏览 器 类 型 ? 
. 下 面 文本 中 显示 的 是 来 自 服务 器 的 回答 ， 以 响应 上 述 问题 中 HTTP GET 报 文 。 回 答 下 列 问 题 ， 指 出 
你 在 下 面 报 文中 找到 答案 的 地 方 。 


HTTP/1.1 200 OK<cr><lf>Date: Tue, 07 Mar 2008 

12:39:45GMT<cr><lf>Server: Apache/2.0.52 (Fedora) 

<cer><lf>Last-Modified: Sat, 10 Dec2005 18:27:46 

GMT <cr><lf>ETag: “526c3-£22-a88a4c80”"<cr><lf>Accept- 

Ranges: bytes<cr><lf>Content-Length: 3874<cr><lf> 

Keep-Alive: timeout=max=100<cr><lf>Connection: 

Keep-Alive<cr><lf>Content-Type: text/html; charset= 

ISO-8859-1<cr><lf><cr><lf><!doctype html public ”- 

//w3c//dtd html 4.0transitional//en”><lf><html><l1f> 

<head><lf> <meta http-equiv=”"Content-Type” 

content="text/html; charset=iso-8859-1"><lf> <meta 

name="GENERATOR” content="Mozilla/4.79 [en] (Windows NT 

5.0; U) Netscape]”><l1f> <title>CMPSCI 453 / 591 / 

NTU-ST550ASpring 2005 homepage</title><lf></head><lf> 

<much more document text following here (not shown)> 

a 服务 器 能 否 成 功 地 找到 那个 文档 ?该 文档 提供 回答 是 什么 时 间 ? 

b. 该 文档 最 后 修改 是 什么 时 间 ? 

c. 文档 中 被 返回 的 字 节 有 和 多少? 

d. 文档 被 返回 的 前 5 个 字 节 是 什么 ? 该 服务 器 同意 一 条 持续 连接 吗 ? 

. 获取 HTTP/1. 1 规范 (RFC 2616) 。 回 答 下 面 问题 : 

a. 解释 在 客户 和 服务 器 之 间 用 于 指示 关闭 持续 连接 的 信 令 机 制 。 客 户 、 服 务 器 或 两 者 都 能 发 送信 令 
通知 连接 关闭 吗 ? 

b. HTTP 提供 了 什么 加 密 服务 ? 

c. 一 个 客户 能 够 与 一 个 给 定 的 服务 器 打开 3 条 或 更 多 条 并 发 连接 吗 ? 

d 如 果 一 个 服务 器 或 一 个 客户 检测 到 连接 已 经 空闲 一 段 时 间 ， 该 服务 器 或 客户 可 以 关闭 两 者 之 间 的 
传输 连接 。 一 侧 开始 关闭 连接 而 另 一 侧 通过 该 连接 传输 数据 是 可 能 的 吗 ? 请 解释 。 

. 假定 你 在 浏览 器 中 点 击 一 条 超 链接 获得 Web 页 面 。 相 关联 的 URL 的 IP 地 址 没有 缓存 在 本 地 主机 上 ， 

因此 必须 使 用 DNS lookup 以 获得 该 卫 地 址 。 如 果 主 机 从 DNS 得 到 IP 地 址 之 前 已 经 访问 了 个 DNS 

服务 器 ; 相继 产生 的 RTT 依次 为 RTT, 、…、RTT,。 进 一 步 假 定 与 链 路 相关 的 Web 页 面 只 包含 一 个 

对 象 ， 即 由 少量 的 HTML 文本 组 成 。 令 RIT, 表示 本 地 主机 和 包含 对 象 的 服务 器 之 间 的 RTT 值 。 假 定 

该 对 象 传输 时 间 为 零 ， 则 从 该 客户 点 击 该 超 链 接 到 它 接收 到 该 对 象 需要 多 长 时 间 ? 

. 参照 习题 P7 ， 假 定 在 同一 服务 器 上 某 HTML 文件 引用 了 8 个 非常 小 的 对 象 。 忽 略 发 送 时 间 ， 在 下 列 

情况 下 需要 多 长 时 间 : 

a. 没有 并 行 TCP 连接 的 非 持续 HTTP。 
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b 配置 有 5 个 并 行 连接 的 非 持续 HTTP. 
c. 持续 HTTP, 


. 考虑 图 2-12， 其 中 有 一 个 机 构 的 网 络 和 因特网 相连 。 假 定 对 象 的 平均 长 度 为 850 000 比特 ， 从 这 个 机 


构 网 的 浏览 器 到 初始 服务 器 的 平均 请 求 率 是 每 秒 16 个 请 求 。 还 假定 从 接 人 链 路 的 因特网 一 侧 的 路 由 
器 转发 一 个 HTTP 请 求 开 始 ， 到 接收 到 其 响应 的 平均 时 间 是 3 秒 (参见 2.2.5 节 )。 将 总 的 平均 响应 
时 间 建 模 为 平均 接 人 时 延 〈 即 从 因特网 路 由 器 到 机 构 路 由 器 的 时 延 ) 和 平均 因特网 时 延 之 和 。 对 于 
平均 接 入 时 延 ,使 用 A/(1 - AB), SP A 是 跨越 接 人 链 路 发 送 一 个 对 象 的 平均 时 间 ，B 是 对 象 对 该 
接 入 链 路 的 平均 到 达 率 。 

a 求 出 总 的 平均 响应 时 间 。 

b. 现在 假定 在 这 个 机 构 LAN 中 安装 了 一 个 缓存 器 。 假 定 命中 率 为 0.4， 求 出 总 的 响应 时 间 。 

考虑 一 条 10 米 短 链 路 ， 某 发 送 方 经 过 它 能 够 以 150bps 速率 双向 传输 。 假 定 包 含 数 据 的 分 组 是 
100 000 比 特长 ， 仅 包含 控制 (如 ACK 或 握手 ) 的 分 组 是 200 比特 长 。 假 定 N 个 并 行 连接 每 个 都 获 
得 1/N 的 链 路 带宽 。 现 在 考虑 HTTP 协议 ， 并 且 假 定 每 个 下 载 对 象 是 100Kb 长 ， 这 些 初始 下 载 对 象 
包含 10 个 来 自 相同 发 送 方 的 引用 对 象 。 在 这 种 情况 下 ， 经 非 持续 HTTP 的 并 行 实例 的 并 行 下载 有 意 
义 吗 ? 现在 考虑 持续 HTTP。 你 期 待 这 比 非 持续 的 情况 有 很 大 增益 吗 ? 评价 并 解释 你 的 答案 。 

考虑 在 前 一 个 习题 中 引出 的 情况 。 现 在 假定 该 链 路 由 Bob 和 4 个 其 他 用 户 所 共享 。Bob 使 用 非 持续 
HTTP 的 并 行 实例 ， 而 其 他 4 个 用 户 使 用 无 并 行 下 载 的 非 持 续 HTTP, 

a. Bob 的 并 行 连接 能 够 帮助 他 更 快 地 得 到 Web 页 面 吗 ? 

b 如 果 所 有 5 个 用 户 打开 5 个 非 持续 HTTP 并 行 实例 ， 那 么 Bob 的 并 行 连接 仍 将 是 有 好 处 的 吗 ? 为 什么 ? 
写 一 个 简单 的 TCP 程序 ， 使 服务 器 接收 来 自 客户 的 行 并 将 其 打印 在 服务 器 的 标准 输出 上 。 CAT 
过 修改 本 书 中 的 TCPServer. py 程序 实现 上 述 任务 。) 编译 并 执行 你 的 程序 。 在 另 一 台 有 浏览 器 的 机 
器 上 ， 设 置 浏 览 器 的 代理 服务 器 为 你 正在 运行 服务 器 程序 的 机 器 ， 同 时 适当 地 配置 端口 号 。 这 时 你 
的 浏览 器 向 服务 器 发 送 GET 请 求 报 文 ， 你 的 服务 器 应 当 在 其 标准 输出 上 显示 该 报 文 。 使 用 这 个 平台 
来 确定 你 的 浏览 器 是 否 对 本 地 缓存 的 对 象 产 生 了 条 件 GET 报 文 。 

SMTP 中 的 MAIL FROM 与 该 邮件 报 文 自身 中 的 From: 之 间 有 什么 不 同 ? 

SMTP 是 怎样 标识 一 个 报 文体 结束 的 ? HTTP 是 怎样 做 的 呢 ? HTTP 能 够 使 用 与 SMTP 标识 一 个 报 文 
体 结束 相同 的 方法 吗 ? 试 解释 。 

阅读 用 于 SMTP 的 RFC 5321, MTA 代表 什么 ? 考虑 下 面 收 到 的 垃圾 邮件 (从 一 份 真实 垃圾 邮件 修改 
得 到 ) 。 假 定 这 封 垃圾 邮件 的 唯一 始作俑者 是 恶意 的 ， 而 其 他 主机 是 诚实 的 ， 指 出 产生 了 这 封 垃 圾 
邮件 的 恶意 主机 。 


From - Fri Nov 07 13:41:30 2008 

Return-Path: <tennis5@pp33head.com> 

Received: from barmail.cs.umass.edu (barmail.cs.umass. 
edu 

(128.119.240.3]) by cs.umass.edu (8.13.1/8.12.6) for 
<hg@cs.umass.edu>; Fri, 7 Nov 2008 13:27:10 -0500 
Received: from asusus-4b96 (localhost [127.0.0.1]) by 
barmail.cs.umass.edu (Spam Firewall) for <hg@cs.umass. 
edu>; Fri, 7 

Nov 2008 13:27:07 -0500 (EST) 

Received: from asusus-4b96 ([58.88.21.177]) by barmail. 
cs.umass.edu 

for <hg@cs.umass.edu>; Fri, 07 Nov 2008 13:27:07 -0500 
(EST) 

Received: from [58.88.21.177] by inbnd55.exchangeddd. 
com; Sat, 8 

Nov 2008 01:27:07 +0700 

From: “Jonny” <tennis5@pp33head.com> 

To: <hg@cs.umass.edu> 


Subject: How to secure your savings 


阅读 POP3 的 RFC, Bf RFC 1939, UIDL POP3 命令 的 目的 是 什么 ? 
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考虑 用 POP3 访问 你 的 电子 邮件 。 
a 假定 你 已 经 配置 以 下 载 并 删除 模式 运行 的 POP 邮件 客户 。 完 成 下 列 事务 : 


A 
H 
z 
a 
A 


: retr 1 
:1a blah ... 
WES Es) Gis blah 


S 
S 
Se . 
名 
S 


iD 


a 


. 假定 你 已 经 配置 以 下 载 并 保持 模式 运行 的 POP 邮件 客户 。 完 成 下 列 事务 : 

C: list 

S: 1 498 

S: 2 912 

S: . 

C: retr 1 

S: blah blah ... 
和 blah 
S: . 

4 
? 

c. 假定 你 已 经 配置 以 下 载 并 保持 模式 运行 的 POP 邮件 客户 。 使 用 (b) 中 的 记录 ， 假 定 你 检索 报 文 
1 和 2， 退 出 POP，5 分 钟 以 后 ， 你 再 访问 POP 以 检索 新 电子 邮件 。 BEER 5 分 钟 间隔 内 ， 没 
有 新 报 文 发 送 给 你 。 给 出 第 二 种 POP 会 话 的 记录 。 

如 题 : 

a. 什么 是 whois 数据 库 ? 

b. 使 用 因特网 上 的 各 种 whois 数据 库 ， 获 得 两 台 DNS 服务 器 的 名 字 。 指 出 你 使 用 的 是 哪个 whois 数据 库 。 

c. 你 本 地 机 器 上 使 用 nslookup 向 3 4 DNS 服务 器 发 送 DNS 查询 : 你 的 本 地 DNS 服务 器 和 两 台 你 在 
(b) 中 发 现 的 DNS 服务 器 。 尝 试 对 类 型 A4、NS 和 MX 报告 进行 查询 。 总 结 你 的 发 现 。 

d. 使 用 nslookup 找 出 一 台 具 有 多 个 IP 地 址 的 Web 服务 器 。 你 所 在 的 机 构 (学 校 或 公司 ) 的 Web 服 
务 器 具有 多 个 IP 地 址 吗 ? 

e. 使 用 ARIN whois 数据 库 ， 确 定 你 所 在 大 学 使 用 的 IP Heh yi El 

f 描述 一 个 攻击 者 在 发 动 攻击 前 ， 能 够 怎样 利用 whois 数据 库 和 nslookup 工具 来 执行 对 一 个 机 构 的 侦察 。 

g 讨论 为 什么 whois 数据 库 应 当 为 公众 所 用 。 

在 本 习题 中 ， 我 们 使 用 在 Unix 和 Linux 主机 上 可 用 的 dig 工具 来 探索 DNS 服务 器 的 等 级 结构 。 

图 2-18 讲 过 ， 在 DNS 等 级 结构 中 较 高 的 DNS 服务 器 授权 对 该 等 级 结构 中 较 低 DNS 服务 器 的 DNS 请 

求 ; 这 是 通过 向 DNS 客户 发 送 回 那 台 较 低 层次 的 DNS 服务 器 的 名 字 来 实现 的 。 先 阅读 dig 的 帮助 

页 ， 再 回答 下 列 问 题 。 

a. 从 一 台 根 DNS 服务 器 (从 根 服务 器 [a-m].root- servernet 之 一 ) 开始 ， 通 过 使 用 dig 得 到 你 所 在 系 的 
Web 服务 器 的 IP 地 址 ， 发 起 一 系列 查询 。 显 示 回 答 你 的 查询 的 授权 链 中 的 DNS 服务 器 的 名 字 列 表 。 

b. 对 几 个 流行 Web 站 点 如 google. com, yahoo. com 或 amazon. com， 重 复 上 一 小 题 。 

假定 你 能 够 访问 所 在 系 的 本 地 DNS 服务 器 中 的 缓存 。 你 能 够 提出 一 种 方法 来 粗略 地 确定 在 你 所 在 系 

的 用 户 中 最 为 流行 的 Web 服务 器 (你 所 在 系 以 外 ) 吗 ? 解释 原因 。 


. 假设 你 所 在 系 具 有 一 台 用 于 系 里 所 有 计算 机 的 本 地 DNS 服务 器 。 你 是 普通 用 户 ( 即 你 不 是 网 络 / 系 


统管 理 员 )。 你 能 够 确定 是 否 在 几 秒 前 从 你 系 里 的 一 台 计 算 机 可 能 访问 过 一 台 外 部 Web 站 点 吗 ? 解 
释 原因 。 

考虑 向 入 个 对 等 方 分 发 =15Gb 的 一 个 文件 。 该 服务 器 具有 u, =30Mbps 的 上 载 速率 ， 每 个 对 等 方 
具有 d; =2Mbps 的 下 载 速率 和 上 载 速率 u。 对 于 N=10、100 和 -1000 } H. u =300kbps, 700kbps 和 
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P23. 


P25. 


P26. 


P27. 


P28. 


P29. 


P30. 
P31. 


P32. 


é 





2Mbps, XIF N Al u 的 每 种 组 合 绘制 出 确定 最 小 分 发 时 间 的 图 表 。 需 要 分 别针 对 客户 -服务 器 分 发 
和 P2P 分 发 两 种 情况 制作 。 

考虑 使 用 一 种 客户 -服务 器 体系 结构 向 N 个 对 等 方 分 发 一 个 下 比特 的 文件 。 假 定 一 种 某 服务 器 能 够 
同时 向 多 个 对 等 方 传输 的 流体 模型 ， 只 要 组 合 速率 不 超过 wx. ， 则 以 不 同 的 速率 向 每 个 对 等 方 传输 。 
a 假定 ww/N<dus。 定 义 一 个 具有 NF/u, 分 发 时 间 的 分 发 方案 。 

b. 假定 w/N>d。ss。 定 义 一 个 具有 F/dii, 分 发 时 间 的 分 发 方案 。 

c 得 出 最 小 分 发 时 间 通 常 是 由 max| NF/u,，F/ds,| 所 决定 的 结论 。 


. 考虑 使 用 P2P 体系 结构 向 N 个 用 户 分 发 比特 的 一 个 文件 。 假 定 一 种 流体 模型 。 为 了 简化 起 见 ， 假 


E du 很 大 ， 因 此 对 等 方 下 载 带宽 不 会 成 为 瓶颈 。 

a. (RE u, < (u, +u, + +uy)/N, 定义 一 个 具有 F/u, 分 发 时 间 的 分 发 方案 。 

b. (BÆ u, > (u, tu, +… +uny)/AN。 定 义 一 个 具有 NF/(u, tu, + +u) 分 发 时 间 的 分 发 方案 。 

c 得 出 最 小 分 发 时 间 通 常 是 由 max| F/u,, NF/(u,+u, +… +uy)| 所 决定 的 结论 。 

考虑 在 一 个 用 个 活跃 对 等 方 的 覆盖 网 络 中 ， 每 对 对 等 方 有 一 条 活跃 的 TCP 连接。 此外， 假定 该 

TCP 连接 通过 总 共 村 台 路 由 器 。 在 对 应 的 覆盖 网 络 中 ， 有 多 少 节 点 和 边 ? 

假定 Bob 加 入 BitTorrent， 但 他 不 希望 向 任何 其 他 对 等 方 上 载 任何 数据 (因此 称 为 搭便 车 ) 。 

a. Bob 声称 他 能 够 收 到 由 该 社区 共享 的 某 文件 的 完整 副本 。Bob 所 言 是 可 能 的 吗 ? 为 什么 ? 

b. Bob 进一步 声称 他 还 能 够 更 为 有 效 地 进行 他 的 “搭便 车 ”， 方 法 是 利用 所 在 系 的 计算 机 实验 室 中 
的 多 台 计 算 机 (具有 不 同 的 耳 地 址 ) 。 他 怎样 才能 做 到 这 些 呢 ? 

考虑 一 个 具有 N 个 视频 版 本 (具有 WV 个 不 同 的 速率 和 质量 ) 和 个 音频 版 本 (具有 N 个 不 同 的 速率 

和 质量 ) 的 DASH 系统 。 假 设 我 们 想 允 许 播放 者 在 任何 时 间 选 择 N 个 视频 版 本 和 WN 个 音频 版 本 之 一 : 

a. 如 果 我 们 生成 音频 与 视频 混合 的 文件 ， 因 此 服务 器 在 任何 时 间 仅 发 送 一 个 媒体 流 ， 该 服务 器 将 需 
要 存储 多 少 个 文件 (每 个 文件 有 一 个 不 同 的 URL)? 

b. 如 果 该 服务 器 分 别 发 送 音 频 流 和 视频 流 并 且 与 客户 同步 这 些 流 ， 该 服务 器 将 需要 存储 多 少 个 文件 ? 

在 一 台 主 机 上 安装 编译 TCPClient 和 UDPClient Python 程序 ， 在 另 一 台 主 机 上 安装 编译 TCPServer 和 

UDPServer 程序 。 

a. 假设 你 在 运行 TCPServer 之 前 运行 TCPClient， 将 发 生 什 么 现象 ? 为 什么 ? 

b. 假设 你 在 运行 UDPServer 之 前 运行 UDPClient， 将 发 生 什 么 现象 ? 为 什么 ? 

c 如 果 你 对 客户 端 和 服务 器 端 使 用 了 不 同 的 端口 ， 将 发 生 什么 现象 ? 

假定 在 UDPClient. py 中 在 创建 套 接 字 后 增加 了 下 面 一 行 : 


clientSocket.bind((’’, 5432)) 


有 必要 修改 UDPServer. py 吗 ? UDPClient 和 UDPServer 中 的 套 接 字 端口 号 是 多 少 ?9 在 变化 之 前 它们 是 
多 少 ? 

你 能 够 配置 浏览 器 以 打开 对 某 Web 站 点 的 多 个 并 行 连接 吗 ? 有 大 量 的 并 行 TCP 连接 的 优点 和 缺点 
是 什么 ? 

我 们 已 经 看 到 因特网 TCP 套 接 字 将 数据 处 理 为 字 节 流 ， 而 UDP 套 接 字 识别 报 文 边界 。 面 向 字 节 API 
与 显 式 识 别 和 维护 应 用 程序 定义 的 报 文 边界 的 API 相 比 ， 试 给 出 一 个 优点 和 一 个 缺点 。 

什么 是 Apache Web 服务 器 ? 它 值 多 少 钱 ? 它 当 前 有 多 少 功能 ? 为 回答 这 个 问题 ， 你 也 许 要 看 一 下 
维基 百科 。 


FE, 套 接 字 编程 作业 


配套 Web 网 站 包括 了 6 个 套 接 字 编程 作业 。 前 四 个 作业 简 述 如 下 。 第 5 个 作业 利用 了 ICMP 协议 ， 


在 第 5 章 结尾 简 述 。 第 6 个 作业 使 用 了 多 媒体 协议 ， 在 第 9 章 结尾 进行 总 结 。 极 力 推荐 学 生 完成 这 些 作 
业 中 的 几 个 〈 如 果 不 是 全 部 的 话 ) 。 学 生 能 够 在 Web 网 站 http://www. pearsonhighered. com/cs- resources 上 
找到 这 些 作 业 的 全 面 细 节 ， 以 及 Python 代码 的 重要 片段 。 
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作业 1: Web 服务 器 

在 这 个 编程 作业 中 ， 你 将 用 Python 语言 开发 一 个 简单 的 Web 服务 器 ， 它 仅 能 处 理 一 个 请 求 。 具 体 而 
， 你 的 Web 服务 器 将 : (1) 当 一 个 客户 (浏览 器 ) 联系 时 创建 一 个 连接 套 接 字 ; (2) 从 这 个 连接 接收 
HTTP 请 求 ， (3) 解释 该 请 求 以 确定 所 请 求 的 特定 文件 ; (4) 从 服务 器 的 文件 系统 获得 请 求 的 文件 ; 
(5) 创建 一 个 由 请 求 的 文件 组 成 的 HTTP 响应 报 文 ， 报 文 前 面 有 首部 行 ; (6) 经 TCP 连接 向 请 求 的 浏览 器 发 
送 响应 。 如 果 浏 览 器 请 求 一 个 在 该 服务 器 中 不 存在 的 文件 ， 服 务 器 应 当 返回 一 个 “404 Not Found” 差 错 报 文 。 

在 配套 网 站 中 ， 我 们 提供 了 用 于 该 服务 器 的 框架 代码 。 你 的 任务 是 完善 该 代码 ， 运 行 你 的 服务 器 ， 
通过 在 不 同 主机 上 运行 的 浏览 器 发 送 请 求 来 测试 该 服务 器 。 如 果 运 行 你 服务 器 的 主机 上 已 经 有 一 个 Web 
服务 器 在 运行 ， 你 应 当 为 该 Web 服务 器 使 用 一 个 不 同 于 80 端口 的 其 他 端口 。 

作业 2: UDP ping 程序 

在 这 个 编程 作业 中 ， 你 将 用 Python 编写 一 个 客户 ping 程序 。 该 客户 将 发 送 一 个 简单 的 ping 报 文 ， 接 
收 一 个 从 服务 器 返回 的 对 应 pong 报 文 ， 并 确定 从 该 客户 发 送 ping 报 文 到 接收 到 pong 报 文 为 止 的 时 延 。 
该 时 延 称 为 往返 时 延 (RTT) 。 由 该 客户 和 服务 器 提供 的 功能 类 似 于 在 现代 操作 系统 中 可 用 的 标准 ping 程 
序 。 然 而 ， 标 准 的 ping 使 用 互联 网 控制 报 文 协议 (ICMP) (我 们 将 在 第 5 章 中 学 习 ICMP) 。 此 时 我 们 将 
创建 一 个 非 标准 (但 简单 ) 的 基于 UDP 的 ping 程序 。 

你 的 ping 程序 经 UDP 向 目标 服务 器 发 送 10 个 ping 报 文 。 对 于 每 个 报 文 ， 当 对 应 的 pong 报 文 返回 
时 ， 你 的 客户 要 确定 和 打印 RTT。 因 为 UDP 是 一 个 不 可 靠 的 协议 ， 由 客户 发 送 的 分 组 可 能 会 丢失 。 为 
此 ， 客 户 不 能 无 限期 地 等 待 对 ping 报 文 的 回答 。 客 户 等 待 服务 器 回答 的 时 间 至 多 为 1 秒 ; 如 果 没 有 收 到 
回答 ， 客 户 假定 该 分 组 丢失 并 相应 地 打印 一 条 报 文 。 

在 此 作业 中 ， 你 将 给 出 服务 器 的 完整 代码 〈 在 配套 网 站 中 可 找到 ) 。 你 的 任务 是 编写 客户 代码 ， 该 
代码 与 服务 器 代码 非常 类 似 。 建 议 你 先 仔细 学 习 服 务 器 的 代码 ， 然 后 编写 你 的 客户 代码 ， 可 以 随意 地 从 
服务 器 代码 中 剪贴 代码 行 。 

作业 3: 邮件 客户 

这 个 编程 作业 的 目的 是 创建 一 个 向 任何 接收 方 发 送 电子 邮件 的 简单 邮件 客户 。 你 的 客户 将 必须 与 邮件 
服务 器 〈 如 谷歌 的 电子 邮件 服务 器 ) 创建 一 个 TCP 连接 ,使 用 SMTP 协议 与 邮件 服务 器 进行 交谈 ， 经 该 邮 
件 服务 器 向 某 接 收 方 〈《 如 你 的 朋友 ) 发 送 一 个 电子 邮件 报 文 ， 最 后 关闭 与 该 邮件 服务 器 的 TCP 连接 。 

对 本 作业 ， 配 套 Web 站 点 为 你 的 客户 提供 了 框架 代码 。 你 的 任务 是 完善 该 代码 并 通过 向 不 同 的 用 户 
账户 发 送 电子 邮件 来 测试 你 的 客户 。 你 也 可 以 尝试 通过 不 同 的 服务 器 〈 例 如 谷歌 的 邮件 服务 器 和 你 所 在 
大 学 的 邮件 服务 器 ) 进行 发 送 。 

作业 4: 多 线程 Web 代理 服务 器 

在 这 个 编程 作业 中 ， 你 将 研发 一 个 简单 的 Web 代理 服务 器 。 当 你 的 代理 服务 器 从 一 个 浏览 器 接收 到 
对 某 对 象 的 HTTP 请 求 ， 它 生成 对 相同 对 象 的 一 个 新 HTTP 请 求 并 向 初始 服务 器 发 送 。 当 该 代理 从 初始 服 
务 器 接收 到 具有 该 对 象 的 HTTP 响应 时 ， 它 生成 一 个 包括 该 对 象 的 新 HTTP 响应 ， 并 发 送 给 该 客户 。 这 个 
代理 将 是 多 线程 的 ， 使 其 在 相同 时 间 能 够 处 理 多 个 请 求 。 

对 本 作业 而 言 ， 配 套 Web 网 站 对 该 代理 服务 器 提供 了 框架 代码 。 你 的 任务 是 完善 该 代码 ， 然 后 测试 
你 的 代理 ， 方 法 是 让 不 同 的 浏览 器 经 过 你 的 代理 来 请 求 Web 对 象 。 


j j Wireshark 实验 : HTTP 


在 实验 1 中 , 我们 已 经 初步 使 用 了 Wireshark 分 组 嗅 探 器 ， 现 在 准备 使 用 Wireshark 来 研究 运行 中 的 
协议 。 在 本 实验 中 , 我 们 将 研究 HTTP 协议 的 几 个 方面 : 基本 的 GET/ 回 答 交 互 ，HTTP 报 文 格式 ， 检 索 
大 HTML Xt, ERRARE URL 的 HTML 文件 ， 持 续 和 非 持续 连接 ，HTTP 鉴别 和 安全 性 。 

如 同 所 有 的 Wireshark 实验 一 样 ， 对 该 实验 的 全 面 描述 可 查阅 本 书 的 Web 站 点 http://www. pearson- 


highered. com/cs- resources 
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‘ll Wireshark 实验 : DNS 


在 本 实验 中 ， 我 们 仔细 观察 DNS 的 客户 端 (DNS 是 用 于 将 因特网 主机 名 转换 为 IP 地 址 的 协议 ) 。 
2.4 节 讲 过 ， 在 DNS 中 客户 角色 是 相当 简单 的 : 客户 向 它 的 本 地 DNS 服务 器 发 送 一 个 请 求 ， 并 接收 返回 
的 响应 。 在 此 过 程 中 发 生 的 很 多 事情 均 不 为 DNS 客户 所 见 ， 如 等 级 结构 的 DNS 服务 器 互相 通信 递归 地 或 
迭代 地 解析 该 客户 的 DNS 请 求 。 然 而 ， 从 DNS 客户 的 角度 而 言 ， 该 协议 是 相当 简单 的 ， 即 向 本 地 DNS 
服务 器 发 送 一 个 请 求 ， 从 该 服务 器 接收 一 个 响应 。 在 本 实验 中 我 们 观察 运转 中 的 DNS。 

如 同 所 有 的 Wireshark 实验 一 样 ， 在 本 书 的 Web 站 点 http://www. awl. com/kurose- ross 可 以 找到 本 实 
验 的 完整 描述 。 


人 物 专访 


Marc Andreessen 是 Mosaic 的 共同 发 明 人 ，Mosaic 是 一 种 Web 浏览 器 ， 正 是 
它 使 万 维 网 在 1993 年 流行 起 来 。Mosaic 具有 一 个 清晰 、 易 于 理解 的 界面 ， 是 首 
个 能 谈 在 文本 中 显示 图 像 的 浏览 器 。 在 1994 4, Mare Andreessen 和 Jim Clark 
创办 了 Netscape 公司 ， 其 测 览 器 是 到 20 世纪 90 年 代 中 期 为 止 最 为 流行 的 。 
Netscape 也 研发 了 安全 套 接 字 层 (SSL) 协议 和 许多 因特网 服务 器 产品 ， 包 括 
邮件 服务 器 和 基于 SSL 的 Web 服务 器 。 他 现在 是 风险 投资 公司 Andreessen 
Horowitz 的 共同 黄 基 人 和 一 般 股 东 ， 对 包括 Facebook, Foursquare, Groupon, 
Jawbone, Twitter 和 Zynga 等 公司 的 财产 投资 搭配 进行 监管 。 他 服务 于 包括 
Bump, eBay, Glam Media, Facebook 和 HP 等 在 内 的 多 个 董事 会 。 他 具有 美国 
伊利 诺 伊 大 学 厄 巴 纳 -香槟 分 校 的 计算 机 科学 理学 学 士 学 位 。 








Marc Andreessen 


。 您 是 怎样 变 得 对 计算 感 兴趣 的 ? 您 过 去 一 直 知 道 您 要 从 事 信息 技术 吗 ? 

在 我 长 大 成 人 的 过 程 中 ， 视 频 游 戏 和 个 人 计算 正好 成 为 成 功 而 风行 一 时 的 事物 ， 在 20 世纪 70 年代 后 
期 和 80 年 代 初 期 ， 个 人 计算 成 为 新 技术 发 展 前 沿 。 那 时 不 具有 苹果 和 IBM 的 个 人 计算 机 ， 而 且 有 如 Com- 
modore 和 Atari 等 数 以 百 计 的 新 公司 。 我 在 10 岁 时 用 一 本 名 为 《简明 BASIC 速成 》( Instant Freeze- Dried 
BASIC) 的 书 进行 自学 ， 并 在 12 岁 时 得 到 自己 的 第 一 台 计算 机 (TRS-80 Color Computer， 查 查 它 !) 。 

。 请 描述 您 职业 生涯 中 干 过 的 一 两 个 最 令 人 激动 的 项 目 。 最 大 的 挑战 是 什么 ? 

考 庸 置疑， 最 令 人 兴奋 的 项 目 是 1992 ~ 1993 年 的 初始 Mosaic Web 浏览 器 ， 最 大 的 挑战 是 让 任何 人 从 
此 往 后 都 认真 地 对 待 它 。 在 那个 时 候 ， 每 个 人 都 认为 交互 式 未 来 将 是 由 大 型 公司 宣布 的 “交互 式 电视 ”， 
而 非 由 新 兴 公 司 发 明 的 因特网 。 

。 您 对 网 络 和 因特网 未 来 的 什么 东西 感到 兴奋 ? 您 最 为 关注 什么 

最 为 兴奋 的 东西 是 程序 员 和 企业 家 能 够 探索 的 巨大 的 尚 待 开发 的 应 用 和 服务 领域 ， 即 因特网 已 经 释 
放 的 创造 性 到 达 了 一 种 我 们 以 前 从 未 预见 到 的 水 平 。 我 最 关注 是 “ 意 想 不 到 的 后 果 ” 的 原则 ， 即 我 们 并 
不 总 是 知道 我 们 所 做 事情 的 后 果 ， 例 如 因特网 被 政府 所 用 ， 使 监视 居民 到 达 了 一 种 新 水 平 。 

© 随 着 Web 技术 的 进展 ， 学 生 们 有 什么 应 当 特别 要 了 解 的 ? 

改变 的 速度 ， 即 对 学 习 来 说 ， 最 重要 的 东西 是 学 习 的 方法 ， 在 特定 的 技术 中 如 何 灵活 地 适应 改变 ， 
当 你 在 职业 生涯 中 前 行 时 ， 在 新 的 机 会 和 可 能 性 方面 如 何 保持 开放 的 思想 。 

。 是 谁 激发 了 您 的 职业 灵感 ? 

他 们 是 : Vannevar Bush, Ted Nelson, Doug Engelgart, Nolan Bushnell, Bill Hewlett 和 Dave Packard, Ken 
Olsen, Steve Jobs, Steve Wozniak, Andy Grove, Grace Hopper, Hedy Lamarr, Alan Turing, Richard Stallman, 

。 对 于 要 在 计算 和 信息 技术 领域 谋求 发 展 的 学 生 ， 您 有 什么 忠告 ? 

尽 可 能 深入 地 理解 技术 是 怎样 创造 的 ， 然 后 补充 学 习 商 业 运作 的 原理 。 

。 技术 能 够 解决 世界 的 问题 吗 ? 

不 能 ,但 是 通过 经 济 增长 我 们 推动 人 们 生活 标准 的 改善 。 综 观 历 史 ， 大 多 数 经 济 增长 来 自 技术 ， 
此 就 像 技术 带 来 的 好 处 一 样 。 
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运输 层 位 于 应 用 层 和 网 络 层 之 间 ， 是 分 层 的 网 络 体系 结构 的 重要 部 分 。 该 层 为 运行 在 
不 同 主机 上 的 应 用 进程 提供 直接 的 通信 服务 起 着 至 关 重 要 的 作用 。 我 们 在 本 章 采 用 的 教学 
方法 是 ， 交 替 地 讨论 运输 层 的 原理 和 这 些 原理 在 现 有 的 协议 中 是 如 何 实现 的 。 与 往常 一 
样 ， 我 们 将 特别 关注 因特网 协议 ， 即 TCP 和 UDP 运输 层 协议 。 

我 们 将 从 讨论 运输 层 和 网 络 层 的 关系 开始 。 这 就 为 研究 运输 层 第 一 个 关键 功能 打 好 了 
基础 ， 即 将 网 络 层 的 在 两 个 端 系统 之 间 的 交付 服务 扩展 到 运行 在 两 个 不 同 端 系统 上 的 应 用 
层 进 程 之 间 的 交付 服务 。 我 们 将 在 讨论 因特网 的 无 连接 运输 协议 UDP 时 站 述 这 个 功能 。 

然后 我 们 重新 回 到 原理 学 习 上 ， 面 对 计算 机 网 络 中 最 为 基础 性 的 问题 之 一 ， 即 两 个 实 
体 怎样 才能 在 一 种 会 丢失 或 损坏 数据 的 媒体 上 可 靠 地 通信 。 通 过 一 系列 复杂 性 不 断 增加 
(从 而 更 真实 !) 的 场景 ,我 们 将 逐步 建立 起 一 套 被 运输 协议 用 来 解决 这 些 问题 的 技术 。 然 
后 ,我们 将 说 明 这 些 原理 是 如 何 体 现在 因特网 面向 连接 的 运输 协议 TCP 中 的 。 

接 下 来 我 们 讨论 网 络 中 的 第 二 个 基础 性 的 重要 问题 ， 即 控制 运输 层 实体 的 传输 速率 以 
避免 网 络 中 的 拥塞 ， 或 从 拥塞 中 恢复 过 来 。 我 们 将 考虑 拥塞 的 原因 和 后 果 ， 以 及 常用 的 拥 
塞 控制 技术 。 在 透彻 地 理解 了 拥塞 控制 问题 之 后 ， 我 们 将 研究 TCP 应 对 拥塞 控制 的 方法 。 


3.1 概述 和 运输 层 服务 


在 前 两 章 中 ， 我 们 已 对 运输 层 的 作用 及 其 所 提供 的 服务 有 所 了 解 。 现 在 我 们 快速 地 回 
顾 一 下 前 面 学 过 的 有 关 运 输 层 的 知识 。 

运输 层 协 议 为 运行 在 不 同 主机 上 的 应 用 进程 之 间 提 供 了 逻辑 通信 (logic communica- 
tion) 功能 。 从 应 用 程序 的 角度 看 ， 通 过 逻辑 通信 ， 运 行 不 同 进程 的 主机 好 像 直 接 相连 一 
样 ; 实际 上 ， 这 些 主机 也 许 位 于 地 球 的 两 侧 ， 通 过 很 多 路 由 器 及 多 种 不 同类 型 的 链 路 相 
连 。 应 用 进程 使 用 运输 层 提供 的 逻辑 通信 功能 彼此 发 送 报 文 ， 而 无 须 考虑 承载 这 些 报 文 的 
物理 基础 设施 的 细节 。 图 3-1 图 示 了 逻辑 通信 的 概念 。 

如 图 3-1 所 示 ， 运 输 层 协议 是 在 端 系统 中 而 不 是 在 路 由 器 中 实现 的 。 在 发 送 端 ， 运 输 
层 将 从 发 送 应 用 程序 进程 接收 到 的 报 文 转换 成 运输 层 分 组 ， 用 因特网 术语 来 讲 该 分 组 称 为 
运输 层 报 文 段 (segment) 。 实 现 的 方法 〈 可 能 ) 是 将 应 用 报 文 划分 为 较 小 的 块 ， 并 为 每 块 
加 上 一 个 运输 层 首部 以 生成 运输 层 报 文 段 。 然 后 ， 在 发 送 端 系统 中 ， 运 输 层 将 这 些 报 文 段 
传递 给 网 络 层 ， 网 路 层 将 其 封装 成 网 络 层 分 组 〈 即 数据 报 ) 并 向 目的 地 发 送 。 注 意 到 下 列 
事实 是 重要 的 : 网 络 路 由 器 仅 作 用 于 该 数据 报 的 网 络 层 字段 ; 即 它 们 不 检查 封装 在 该 数据 
报 的 运输 层 报 文 段 的 字段 。 在 接收 端 ， 网 络 层 从 数据 报 中 提取 运输 层 报 文 段 ， 并 将 该 报 文 
段 向 上 交 给 运输 层 。 运 输 层 则 处 理 接收 到 的 报 文 段 ， 使 该 报 文 段 中 的 数据 为 接收 应 用 进程 
使 用 。 

网 络 应 用 程序 可 以 使 用 多 种 的 运输 层 协 议 。 例 如 ， 因 特 网 有 两 种 协议 ， 即 TCP 和 
UDP。 每 种 协议 都 能 为 调用 的 应 用 程序 提供 一 组 不 同 的 运输 层 服务 。 
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图 3-1 运输 层 在 应 用 程序 进程 间 提 供 逻 辑 的 而 非 物理 的 通信 


3.1.1 运输 层 和 网 络 层 的 关系 


前 面 讲 过 ， 在 协议 栈 中 ， 运 输 层 刚 好 位 于 网 络 层 之 上 。 网 络 层 提供 了 主机 之 间 的 逻辑 
通信 ， 而 运输 层 为 运行 在 不 同 主机 上 的 进程 之 间 提 供 了 逻辑 通信 。 这 种 差别 虽然 细微 但 很 
重要 。 我 们 用 一 个 家 庭 类 比 来 帮助 分 析 这 种 差别 。 

考虑 有 两 个 家 庭 ， 一 家 位 于 美国 东海 岸 ， 一 家 位 于 美国 西海 岸 ， 每 家 有 12 个 孩子 。 
东海 岸 家 庭 的 孩子 们 是 西海 岸 家 庭 孩子 们 的 堂 兄 弟 姐 妹 。 这 两 个 家 庭 的 孩子 们 喜欢 彼此 通 
信 ， 每 个 人 每 星期 要 互相 写 一 封 信 ， 每 封 信 都 用 单独 的 信封 通过 传统 的 邮政 服务 传送 。 因 
此 ， 每 个 家 庭 每 星期 向 另 一 家 发 送 144 封 信 。 (如 果 他 们 有 电子 邮件 的 话 ， 这 些 孩 子 可 以 
省 不 少 钱 !) 每 一 个 家 庭 有 个 孩子 负责 收发 邮件 ， 西 海岸 家 庭 是 An 而 东海 岸 家 庭 是 Bil。 
每 星期 An 去 她 的 所 有 兄弟 姐妹 那里 收集 信件 ， 并 将 这 些 信件 交 到 每 天 到 家 门口 来 的 邮政 
服务 的 邮 车 上 。 当 信件 到 达 西 海岸 家 庭 时 ，Ann 也 负责 将 信件 分 发 到 她 的 兄弟 姐妹 手 上 。 
在 东海 岸 家 庭 中 的 Bill 也 负责 类 似 的 工作 。 
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在 这 个 例子 中 ， 邮 政 服务 为 两 个 家 庭 间 提供 逻辑 通信 ， 邮 政 服务 将 信件 从 一 家 送 往 另 
一 家 ， 而 不 是 从 一 个 人 送 往 另 一 个 人 。 在 另 一 方面 ，Ann 和 Bill 为 堂 兄弟 姐妹 之 间 提 供 了 
逻辑 通信 ，Ann 和 Bill 从 兄弟 姐妹 那里 收取 信件 或 到 兄弟 姐妹 那里 交付 信件 。 注 意 到 从 党 
兄弟 姐妹 们 的 角度 来 看 ，Ann 和 Bill 就 是 邮件 服务 ， 尽 管 他 们 只 是 端 到 端 交付 过 程 的 一 部 
分 〈 即 端 系统 部 分 ) 。 在 解释 运输 层 和 网 络 层 之 间 的 关系 时 ， 这 个 家 庭 的 例子 是 一 个 非常 
好 的 类 比 。 

应 用 层 报 文 = 信封 上 的 字符 
进程 = 堂 兄 弟 姐妹 

主机 (又 称 为 端 系统 ) = 家 庭 
运输 层 协议 = Ann 和 Bill 
网 络 层 协议 = 邮政 服务 (包括 邮 车 ) 

我 们 继续 观察 这 个 类 比 。 值 得 注意 的 是 ，Ann 和 Bil 都 是 在 各 自家 里 进行 工作 的 ; 例 
如 ， 他 们 并 没有 参与 任何 一 个 中 间 邮 件 中 心 对 邮件 进行 分 拣 ， 或 者 将 邮件 从 一 个 邮件 中 心 
送 到 另 一 个 邮件 中 心 之 类 的 工作 。 类 似 地 ， 运 输 层 协议 只 工作 在 端 系统 中 。 在 端 系统 中 ， 
运输 层 协 议 将 来 自 应 用 进程 的 报 文 移动 到 网 络 边缘 〈( 即 网 络 层 ) ， 反 过 来 也 是 一 样 ， 但 对 
有 关 这 些 报 文 在 网 络 核心 如 何 移动 并 不 作 任 何 规定 。 事 实 上 ， 如 图 3-1 所 示 ， 中 间 路 由 器 
既 不 处 理 也 不 识别 运输 层 加 在 应 用 层 报 文 的 任何 信息 。 

我 们 还 是 继续 讨论 这 两 家 的 情况 。 现 在 假定 An 和 B 记 外 出 度假 ， 另 外 一 对 堂 兄妹 
(如 Susan 和 Harvey) 接替 他 们 的 工作 ， 在 家 庭 内 部 进行 信件 的 收集 和 交付 工作 。 不 幸 的 
是 ，Susan 和 Harvey 的 收集 和 交付 工作 与 Ann 和 Bill 所 做 的 并 不 完全 一 样 。 由 于 年 龄 更 
小 ，Susan 和 Harvey 收发 邮件 的 次 数 更 少 ， 而 且 偶尔 还 会 丢失 邮件 〈 有 时 是 被 家 里 的 狗 咬 
坏 了 ) 。 因 此 ，Susan 和 Harvey 这 对 和 党 兄妹 并 没有 提供 与 Ann 和 Bill 一样 的 服务 集合 (E 
相同 的 服务 模型 ) 。 与 此 类 似 ， 计 算 机 网 络 中 可 以 安排 多 种 运输 层 协议 ， 每 种 协议 为 应 用 
程序 提供 不 同 的 服务 模型 。 

Ann 和 Bill 所 能 提供 的 服务 明显 受制 于 邮政 服务 所 能 提供 的 服务 。 例 如 ， 如 果 邮 政 服 
务 不 能 提供 在 两 家 之 间 传 递 邮件 所 需 时 间 的 最 长 期 限 (例如 3 天 )， 那 么 Ann 和 Bill 就 不 
可 能 保证 邮件 在 堂 兄 弟 姐妹 之 间 传 递 信件 的 最 长 期 限 。 与 此 类 似 ， 运 输 协 议 能 够 提供 的 服 
务 常常 受制 于 底层 网 络 层 协议 的 服务 模型 。 如 果 网 络 层 协议 无 法 为 主机 之 间 发 送 的 运输 层 
报 文 段 提供 时 延 或 带宽 保证 的 话 ， 运 输 层 协议 也 就 无 法 为 进程 之 间 发 送 的 应 用 程序 报 文 提 
供 时 延 或 带宽 保证 。 

然而 ， 即 使 底层 网 络 协议 不 能 在 网 络 层 提供 相应 的 服务 ， 运 输 层 协议 也 能 提供 某 些 服 
务 。 例 如 ， 如 我 们 将 在 本 章 所 见 ， 即 使 底层 网 络 协议 是 不 可 靠 的 ， 也 就 是 说 网 络 层 协议 会 
使 分 组 丢失 、 算 改 和 元 余 ， 运 输 协议 也 能 为 应 用 程序 提供 可 靠 的 数据 传输 服务 。 另 一 个 例 
子 是 (我 们 在 第 8 章 讨论 网 络 安全 时 将 会 研究 到 ) ， 即 使 网 络 层 不 能 保证 运输 层 报 文 段 的 
机 密 性 ， 运 输 协议 也 能 使 用 加 密 来 确保 应 用 程序 报 文 不 被 人 侵 者 读 取 。 


3. 1.2 因特网 运输 层 概述 


前 面 讲 过 因特网 为 应 用 层 提供 了 两 种 截然 不 同 的 可 用 运输 层 协议 。 这 些 协议 一 种 是 
UDP (用 户 数据 报 协 议 )， 它 为 调用 它 的 应 用 程序 提供 了 一 种 不 可 靠 、 无 连接 的 服务 。 另 
一 种 是 TCP (传输 控制 协议 ) ， 它 为 调用 它 的 应 用 程序 提供 了 一 种 可 靠 的 、 面 向 连接 的 服 
务 。 当 设计 一 个 网 络 应 用 程序 时 ， 该 应 用 程序 的 开发 人 员 必 须 指 定 使 用 这 两 种 运输 协议 中 
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的 哪 一 种 。 如 我 们 在 2. 7 节 看 到 的 那样 ， 应 用 程序 开发 人 员 在 生成 套 接 字 时 必须 指定 是 选 
择 UDP 还 是 选择 TCP。 

为 了 简化 术语 ， 我 们 将 运输 层 分 组 称 为 报 文 段 (segment)。 然 而 ,因特网 文献 (如 
RFC 文档 ) 也 将 TCP 的 运输 层 分 组 称 为 报 文 段 ， 而 常 将 UDP 的 分 组 称 为 数据 报 (data- 
gram) 。 而 这 类 因特网 文献 也 将 网 络 层 分 组 称 为 数据 报 ! 本 书 作为 一 本 计算 机 网 络 的 人 门 
书籍 ， 我 们 认为 将 TCP 和 UDP 的 分 组 统称 为 报 文 段 ， 而 将 数据 报名 称 保留 给 网 络 层 分 组 
不 容易 混淆 。 

在 对 UDP Al TCP 进行 简要 介绍 之 前 ， 简 单 介 绍 一 下 因特网 的 网 络 层 (我 们 将 在 第 4 和 5 
章 中 详细 地 学 习 网 络 层 ) 是 有 用 的 。 因 特 网 网 络 层 协议 有 一 个 名 字 叫 全 ， 即 网 际 协议 。IP 
为 主机 之 间 提 供 了 逻辑 通信 。 了 王 的 服务 模型 是 尽力 而 为 交付 服务 (best-effort delivery serv- 
ice), RERE IP 尽 它 “最 大 的 努力 ”在 通信 的 主机 之 间 交 付 报 文 段 ， 但 它 并 不 做 任何 确 
保 。 特 别 是 ， 它 不 确保 报 文 段 的 交付 ， 不 保证 报 文 段 的 按 序 交 付 ， 不 保证 报 文 段 中 数据 的 
完整 性 。 由 于 这 些 原 因 ，IP 被 称 为 不 可 靠 服 务 (unreliable service)。 在 此 还 要 指出 的 是 ， 
每 台 主机 至 少 有 一 个 网 络 层 地 址 ， 即 所 谓 的 IP 地址。 我 们 在 第 4 和 5 章 将 详细 讨论 全 地 
tk; 在 这 一 章 中 ,我 们 只 需要 记 住 每 台 主机 有 一 个 全 地 址 。 

在 对 IP 服务 模型 有 了 初步 了 解 后 ,我 们 总 结 一 下 UDP 和 TCP 所 提供 的 服务 模型 。 
UDP 和 TCP 最 基本 的 责任 是 ， 将 两 个 端 系统 间 IP 的 交付 服务 扩展 为 运行 在 端 系统 上 的 两 
个 进程 之 间 的 交付 服务 。 将 主机 间 交 付 扩 展 到 进程 间 交 付 被 称 为 运输 层 的 多 路 复 用 
(transport-layer multiplexing) 与 多 路 分 解 (demultiplexing) 。 我 们 将 在 下 一 节 讨 论 运 输 层 的 
多 路 复 用 与 多 路 分 解 。UDP 和 TCP 还 可 以 通过 在 其 报 文 段 首部 中 包括 差错 检查 字段 而 提 
供 完 整 性 检查 。 进 程 到 进程 的 数据 交付 和 差错 检查 是 两 种 最 低 限 度 的 运输 层 服 务 ， 也 是 
UDP 所 能 提供 的 仅 有 的 两 种 服务 。 特 别 是 ， 与 PE, UDP 也 是 一 种 不 可 靠 的 服务 ， 即 
不 能 保证 一 个 进程 所 发 送 的 数据 能 够 完整 无 缺 地 (或 全 部 !) 到 达 目 的 进程 。 在 3.3 节 中 
将 更 详细 地 讨论 UDP。 

另 一 方面 ，TCP 为 应 用 程序 提供 了 几 种 附加 服务 。 首 先 ， 它 提供 可 靠 数据 传输 (relia- 
ble data transfer) 。 通 过 使 用 流量 控制 、 序 号 、 确 认 和 定时 器 (本 章 将 详细 介绍 这 些 技术 ) ， 
TCP 确保 正确 地 、 按 序 地 将 数据 从 发 送 进程 交付 给 接收 进程 。 这 样 TCP 就 将 两 个 端 系统 
间 的 不 可 靠 IP 服务 转换 成 了 一 种 进程 间 的 可 靠 数 据 传 输 服 务 。TCP 还 提供 拥塞 控制 〈con- 
gestion control) 。 拥 塞 控制 与 其 说 是 一 种 提供 给 调用 它 的 应 用 程序 的 服务 ， 不 如 说 是 一 种 
提供 给 整个 因特网 的 服务 ， 这 是 一 种 带 来 通用 好 处 的 服务 。 不 太 严 格 地 说 ，TCP 拥塞 控制 
防止 任何 一 条 TCP 连接 用 过 多 流量 来 淹没 通信 主机 之 间 的 链 路 和 交换 设备 。TCP 力求 为 每 
个 通过 一 条 拥塞 网 络 链 路 的 连接 平等 地 共享 网 络 链 路 带宽 。 这 可 以 通过 调节 TCP 连接 的 发 
送 端 发 送 进 网 络 的 流量 速率 来 做 到 。 在 另 一 方面 ，UDP 流量 是 不 可 调节 的 。 使 用 UDP 传 
输 的 应 用 程序 可 以 根据 其 需要 以 其 愿意 的 任何 速率 发 送 数据 。 

一 个 能 提供 可 靠 数据 传输 和 拥塞 控制 的 协议 必定 是 复杂 的 。 我 们 将 用 几 节 的 篇 幅 来 介 
绍 可 靠 数据 传输 和 拥塞 控制 的 原理 ， 用 另外 几 节 介绍 TCP 协议 本 身 。3.4 ~3.8 节 将 研究 
这 些 主题 。 本 章 采 取 基 本 原理 和 TCP 协议 交替 介绍 的 方法 。 例 如 ， 我 们 首先 在 一 般 环 境 下 
讨论 可 靠 数据 传输 ， 然 后 讨论 TCP 是 怎样 具体 提供 可 靠 数 据 传输 的 。 类 似 地 ， 先 在 一 般 环 
境 下 讨论 拥塞 控制 ,然后 讨论 TCP 是 怎样 实现 拥塞 控制 的 。 但 在 全 面 介绍 这 些 内 容 之 前 ， 
我 们 先 学 习 运 输 层 的 多 路 复 用 与 多 路 分 解 。 





3.2 多 路 复 用 与 多 路 分 解 


在 本 节 中 ， 我 们 讨论 运输 层 的 多 路 复 用 与 多 路 分 解 ， 也 就 是 将 由 网 络 层 提供 的 主机 到 
主机 交付 服务 延伸 到 为 运行 在 主机 上 的 应 用 程序 提供 进程 到 进程 的 交付 服务 。 为 了 使 讨论 
具体 起 见 ， 我 们 将 在 因特网 环境 中 讨论 这 种 基本 的 运输 层 服 务 。 然 而 ， 需 要 强调 的 是 ， 多 
路 复 用 与 多 路 分 解 服务 是 所 有 计算 机 网 络 都 需要 的 。 

在 目的 主机 ， 运 输 层 从 紧邻 其 下 的 网 络 层 接收 报 文 段 。 运 输 层 负责 将 这 些 报 文 段 中 的 
数据 交付 给 在 主机 上 运行 的 适当 应 用 程序 进程 。 我 们 来 看 一 个 例子 。 假 定 你 正 坐 在 计算 机 
前 下 载 Web 页 面 ， 同 时 还 在 运行 一 个 FTP 会 话 和 两 个 Telnet 会 话 。 这 样 你 就 有 4 个 网 络 应 
用 进程 在 运行 ， 即 两 个 Telnet 进程 ， 一 个 FTP 进程 和 一 个 HTTP 进程 。 当 你 的 计算 机 中 的 
运输 层 从 底层 的 网 络 层 接收 数据 时 ， 它 需要 将 所 接收 到 的 数据 定向 到 这 4 个 进程 中 的 一 
个 。 现 在 我 们 来 研究 这 是 怎样 完成 的 。 

首先 回想 2.7 节 的 内 容 ， 一 个 进程 〈 作 为 网 络 应 用 的 一 部 分 ) 有 一 个 或 多 个 套 接 字 
(socket)， 它 相当 于 从 网 络 向 进程 传递 数据 和 从 进程 向 网 络 传递 数据 的 门户 。 因 此 ， 如 
图 3-2 所 示 ， 在 接收 主机 中 的 运输 层 实际 上 并 没有 直接 将 数据 交付 给 进程 ， 而 是 将 数据 交 
给 了 一 个 中 间 的 套 接 字 。 由 于 在 任 一 时 刻 ， 在 接收 主机 上 可 能 有 不 止 一 个 套 接 字 ， 所 以 每 
个 套 接 字 都 有 唯一 的 标识 符 。 标 识 符 的 格式 取决 于 它 是 UDP 还 是 TCP 套 接 字 ， 我 们 将 很 
快 对 它们 进行 讨论 。 





图 3-2 运输 层 的 多 路 复 用 与 多 路 分 解 


现在 我 们 考虑 接收 主机 怎样 将 一 个 到 达 的 运输 层 报 文 段 定向 到 适当 的 套 接 字 。 为 此 目 
的 ， 每 个 运输 层 报 文 段 中 具有 几 个 字段 。 在 接收 端 ， 运 输 层 检查 这 些 字段 ， 标 识 出 接收 套 
接 字 ， 进 而 将 报 文 段 定向 到 该 套 接 字 。 将 运输 层 报 文 段 中 的 数据 交付 到 正确 的 套 接 字 的 工 
作 称 为 多 路 分 解 (demultiplexing) 。 在 源 主 机 从 不 同 套 接 字 中 收集 数据 块 ， 并 为 每 个 数据 
块 封装 上 首部 信息 (这 将 在 以 后 用 于 分 解 ) 从 而 生成 报 文 段 ， 然 后 将 报 文 段 传递 到 网 络 
层 ， 所 有 这 些 工作 称 为 多 路 复 用 ( multiplexing)。 值 得 注意 的 是 ， 图 3-2 中 的 中 间 那 台 主 
机 的 运输 层 必须 将 从 其 下 的 网 络 层 收 到 的 报 文 段 分 解 后 交 给 其 上 的 P, 或 P, 进程 ; 这 一 过 
程 是 通过 将 到 达 的 报 文 段 数据 定向 到 对 应 进程 的 套 接 字 来 完成 的 。 中 间 主 机 中 的 运输 层 也 
必须 收集 从 这 些 套 接 字 输出 的 数据 ， 形 成 运输 层 报 文 段 ， 然 后 将 其 向 下 传递 给 网 络 层 。 尽 
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管 我 们 在 因特网 运输 层 协 议 的 环境 下 引入 了 多 路 复 用 和 多 路 分 解 ， 认 识 到 下 列 事实 是 重要 
的 : 它们 与 在 某 层 (在 运输 层 或 别处 ) 的 单一 协议 何 时 被 位 于 接 下 来 的 较 高 层 的 多 个 协议 
使 用 有 关 。 

为 了 说 明 分 解 的 工作 过 程 ， 再 回顾 一 下 前 面 一 节 的 家 庭 类 比 。 每 一 个 孩子 通过 他 们 的 
名 字 来 标识 。 当 Bill 从 邮递 员 处 收 到 一 批 信件 ， 并 通过 查看 收 信 人 名 字 而 将 信件 亲手 交付 
给 他 的 兄弟 姐妹 们 时 ， 他 执行 的 就 是 一 个 分 解 操 作 。 当 Ann 从 兄弟 姐妹 们 那里 收集 信件 并 
将 它们 交 给 邮递 员 时 ， 她 执行 的 就 是 一 个 多 路 复 用 操作 。 

既然 我 们 理解 了 运输 层 多 路 复 用 与 多 路 分 解 的 作用 ， 那 就 再 来 看 看 在 主机 中 它们 实际 
是 怎样 工作 的 。 通 过 上 述 讨 论 ， 我 们 知道 运输 层 多 路 复 用 要 求 : 中 套 接 字 有 唯一 标识 符 ; 
@ 每 个 报 文 段 有 特殊 字段 来 指示 该 报 文 段 所 要 交付 到 的 套 接 字 。 如 图 3-3 所 示 ， 这 些 特殊 
字段 是 源 端 口号 字段 ( source port number field) 和 目的 端口 32 比 特 
号 字段 (destination port number field), (UDP 报 文 段 和 TCP — 
报 文 段 还 有 其 他 的 一 些 字段 ， 这 些 将 在 本 章 后 继 几 节 中 进行 ee ee re 
Wit.) 端口 号 是 一 个 16 比特 的 数 ， 其 大 小 在 0 ~ 65535 之 
间 。0 ~ 1023 范围 的 端口 号 称 为 周知 端口 号 (well-known port 
number) ， 是 受 限制 的 ， 这 是 指 它们 保留 给 诸如 HTTP ( 它 使 
用 端口 号 80) 和 FIP( 它 使 用 端口 号 21) 之 类 的 周知 应 用 层 “| i Ei y. 
协议 来 使 用 。 周 知 端口 的 列表 在 RFC 1700 中 给 出 ,同时 在 ee 
http://www. iana. org 上 有 更 新 文档 [RFC 3232 ] 。 当 我 们 开发 图 3-3 运输 层 报 文 段 中 的 
一 个 新 的 应 用 程序 时 〈 如 在 2.7 节 中 开发 的 一 个 简单 应 用 程 源 与 目的 端口 字段 
序 ) ， 必 须 为 其 分 配 一 个 端口 号 。 

现在 应 该 清楚 运输 层 是 怎样 能 够 实现 分 解 服务 的 了 : 在 主机 上 的 每 个 套 接 字 能 够 分 配 
一 个 端口 号 ， 当 报 文 段 到 达 主 机 时 ， 运 输 层 检 查 报 文 段 中 的 目的 端口 号 ， 并 将 其 定向 到 相 
应 的 套 接 字 。 然 后 报 文 段 中 的 数据 通过 套 接 字 进 入 其 所 连接 的 进程 。 如 我 们 将 看 到 的 那 
样 ，UDP 大 体 上 是 这 样 做 的 。 然 而 ， 也 将 如 我 们 所 见 ，TCP 中 的 多 路 复 用 与 多 路 分 解 更 为 
复杂 。 

1. 无 连接 的 多 路 复 用 与 多 路 分 解 

2.7.1 节 讲 过 ,在 主机 上 运行 的 Python 程序 使 用 下 面 一 行 代码 创建 了 一 个 UDP 套 
RF: 

clientSocket = socket(AF_INET, SOCK_DGRAM) 

当 用 这 种 方式 创建 一 个 UDP 套 接 字 时 ， 运 输 层 自动 地 为 该 套 接 字 分 配 一 个 端口 号 。 
特别 是 ， 运 输 层 从 范围 1024 ~65535 内 分 配 一 个 端口 号 ， 该 端口 号 是 当前 未 被 该 主机 中 任 
何其 他 UDP 端口 使 用 的 号 。 另 外 一 种 方法 是 ， 在 创建 一 个 套 接 字 后 ， 我 们 能 够 在 Python 
程序 中 增加 一 行 代码 ， 通 过 套 接 字 bind() 方法 为 这 个 UDP 套 接 字 关联 一 个 特定 的 端口 号 
(如 19157): 


clientSocket.bind((’’, 19157)) 


如 果 应 用 程序 开发 者 所 编写 的 代码 实现 的 是 一 个 “周知 协议 ”的 服务 器 端 ， 那 么 开发 
者 就 必须 为 其 分 配 一 个 相应 的 周知 端口 号 。 通 常 ， 应 用 程序 的 客户 端 让 运输 层 自动 地 (并 
且 是 透明 地 ) 分 配 端 口号 ， 而 服务 器 端 则 分 配 一 个 特定 的 端口 号 。 

通过 为 UDP 套 接 字 分 配 端 口号 ， 我 们 现在 能 够 精确 地 描述 UDP 的 复 用 与 分 解 了 。 假 








定 在 主机 A 中 的 一 个 进程 具有 UDP 端口 19157， 它 要 发 送 一 个 应 用 程序 数据 块 给 位 于 主机 
B 中 的 另 一 进程 ， 该 进程 具有 UDP 端口 46428。 主 机 A 中 的 运输 层 创 建 一 个 运输 层 报 文 
段 ， 其 中 包括 应 用 程序 数据 、 源 端口 号 (19157)、 目 的 端口 号 (46428) 和 两 个 其 他 值 
(将 在 后 面 讨论 ， 它 对 当前 的 讨论 并 不 重要 )。 然 后 ， 运 输 层 将 得 到 的 报 文 段 传递 到 网 络 
层 。 网 络 层 将 该 报 文 段 封装 到 一 个 他 数据 报 中 ， 并 尽力 而 为 地 将 报 文 段 交 付 给 接收 主机 。 
如 果 该 报 文 段 到 达 接 收 主机 B， 接 收 主机 运输 层 就 检查 该 报 文 段 中 的 目的 端口 号 (46428) 
并 将 该 报 文 段 交付 给 端口 号 46428 所 标识 的 套 接 字 。 值 得 注意 的 是 ， 主 机 B 能 够 运行 多 个 
进程 ， 每 个 进程 有 自己 的 UDP 套 接 字 及 相应 的 端口 号 。 值 得 注意 的 是 ， 主 机 B 可 能 运行 
多 个 进程 ， 每 个 进程 都 具有 其 自己 的 UDP 套 接 字 和 相 联 系 的 端口 号 。 当 UDP 报 文 段 从 网 
络 到 达 时 ， 主 机 B 通过 检查 该 报 文 段 中 的 目的 端口 号 ， 将 每 个 报 文 段 定向 〈 分 解 ) 到 相 
应 的 套 接 字 。 

注意 到 下 述 事实 是 重要 的 : 一 个 UDP 套 接 字 是 由 一 个 二 元 组 全 面 标识 的 ， 该 二 元 组 
包含 一 个 目的 全 地 址 和 一 个 目的 端口 号 。 因 此 ， 如 果 两 个 UDP 报 文 段 有 不 同 的 源 人 P 地 址 
和 /或 源 端 口号 ,但 具有 相同 的 目的 IP 地 址 和 目的 端口 号 ， 那么 这 两 个 报 文 段 将 通过 相同 
的 目的 套 接 字 被 定向 到 相同 的 目的 进程 。 

你 也 许 现 在 想 知道 ， 源 端口 号 的 用 途 是 什么 呢 ? 如 图 3-4 ra, Æ A 到 B 的 报 文 段 中 ， 
源 端 口号 用 作 “ 返 回 地 址 ”的 一 部 分 ， 即 当 B 需要 回 发 一 个 报 文 段 给 A 时 ，B 到 A 的 报 文 
段 中 的 目的 端口 号 便 从 A 到 B 的 报 文 段 中 的 源 端口 号 中 取 值 。( 完 整 的 返回 地 址 是 A AY IP Hh 
址 和 源 端 口号 。) 举 一 个 例子 ， 回 想 2. 7 节 学 习 过 的 那个 UDP 服务 器 程序 。 在 UDPServer py 
中 ， 服 务 器 使 用 recvfrom() 方 法 从 其 自 客户 接收 到 的 报 文 段 中 提取 出 客户 端 ( 源 ) 端口 号 ， 
然后 ,， 它 将 所 提取 的 源 端 晶 号 作为 目的 端口 号 ， 向 客户 发 送 一 个 新 的 报 文 段 。 


19157 





图 3-4 源 端 口号 与 目的 端口 号 的 反 转 


2. 面向 连接 的 多 路 复 用 与 多 路 分 解 

为 了 理解 TCP 多 路 分 解 ， 我 们 必须 更 为 仔细 地 研究 TCP ERFA TCP 连接 创建 。TCP 
ERTA UDP 套 接 字 之 间 的 一 个 细微 差别 是 ，TCP 套 接 字 是 由 一 个 四 元 组 ( 源 下 地址 ， 
源 端 口号 ， 目 的 全 地 址 ， 目 的 端口 号 ) 来 标识 的 。 因 此 ， 当 一 个 TCP 报 文 段 从 网 络 到 达 
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一 台 主 机 时 ， 该 主机 使 用 全 部 4 个 值 来 将 报 文 段 定向 〈 分 解 ) 到 相应 的 套 接 字 。 特 别 与 
UDP 不 同 的 是 ， 两 个 具有 不 同 源 IP 地 址 或 源 端 口号 的 到 达 TCP 报 文 段 将 被 定向 到 两 个 不 
同 的 套 接 字 ， 除 非 TCP 报 文 段 携带 了 初始 创建 连接 的 请 求 。 为 了 深入 地 理解 这 一 点 ， 我 们 
再 来 重新 考虑 2.7. 2 节 中 的 TCP 客户 - 服务 器 编程 的 例子 : 
e TCP 服务 器 应 用 程序 有 一 个 “欢迎 套 接 字 ”， 它 在 12000 号 端口 上 等 待 来 自 TCP 客 
户 〈 见 图 2-27) 的 连接 建立 请 求 。 
。 TCP 客户 使 用 下 面 的 代码 创建 一 个 套 接 字 并 发 送 一 个 连接 建立 请 求 报 文 段 : 


clientSocket = socket (AF_INET, SOCK_STREAM) 
clientSocket.connect ( (serverName, 12000) ) 


。 一 条 连接 建立 请 求 只 不 过 是 一 个 目的 端口 号 为 12000，TCP 首部 的 特定 “连接 建立 
位 ” 置 位 的 TCP 报 文 段 (在 3.5 节 进 行 讨 论 ) 。 这 个 报 文 段 也 包含 一 个 由 客户 选 
择 的 源 端 口号 。 

© 当 运 行 服务 器 进程 的 计算 机 的 主机 操作 系统 接收 到 具有 目的 端口 12000 的 入 连接 
请 求 报 文 段 后 ， 它 就 定位 服务 器 进程 ， 该 进程 正在 端口 号 12000 等 待 接受 连接 。 
该 服务 器 进程 则 创建 一 个 新 的 套 接 字 : 


connectionSocket, addr = serverSocket.accept () 


。 该 服务 器 的 运输 层 还 注意 到 连接 请 求 报 文 段 中 的 下 列 4 MA: OIR Eh 
端口 号 ; @ 源 主机 J 了 P 地 址 ; 名 该 报 文 段 中 的 目的 端口 号 ; OAH IP Hk, Pre 
建 的 连接 套 接 字 通过 这 4 个 值 来 标识 。 所 有 后 续 到 达 的 报 文 段 ， 如 果 它们 的 源 端 
OS, WES IP 地址 、 目 的 端口 号 和 目的 亿 地 址 都 与 这 4 个 值 匹 配 ， 则 被 分 解 到 
这 个 套 接 字 。 随 着 TCP 连接 完成 ， 客 户 和 服务 器 便 可 相互 发 送 数据 了 。 
服务 器 主机 可 以 支持 很 多 并 行 的 TCP 套 接 字 ， 每 个 套 接 字 与 一 个 进程 相 联系 ， 并 由 其 
四 元 组 来 标识 每 个 套 接 字 。 当 一 个 TCP 报 文 段 到 达 主 机 时 ， 所 有 4 个 字段 ( 源 IP 地 址 ， 
源 端 口 ， 目 的 他 地 址 ， 目 的 端口 ) 被 用 来 将 报 文 段 定向 〈 分 解 ) 到 相应 的 套 接 字 。 

















端口 扫描 | 

我 们 已 经 看 到 一 个 服务 器 进程 潜在 地 在 一 个 打开 的 端口 等 待 远程 客户 的 接触 。 某 些 | 
端口 为 周知 应 用 程序 (例如 Web、FIP、DNS 和 SMTP RAB) 所 预 留 ; 依照 惯例 其 他 
端口 由 流行 应 用 程序 (例如 微软 2000 SQL 服务 器 在 UDP 1434 端口 上 监听 请 求 ) 使 用 。 
因此 ， 如 果 我 们 确定 一 台 主 机 上 打开 了 一 个 端口 ， 也 许 就 能 够 将 该 端口 映射 到 在 该 主机 | 
运行 的 一 个 特定 的 应 用 程序 上 。 这 对 于 系统 管理 员 非 常 有 用 ， 系 统管 理 员 通常 希望 知晓 | 
有 什么 样 的 网 络 应 用 程序 正 运行 在 他 们 的 网 络 主机 上 。 而 攻击 者 为 了 “寻找 突破 口 ”， 
也 要 知道 在 目标 主机 上 有 哪些 端口 打开 。 如 果 发 现 一 台 主 机 正在 运行 具有 已 知 安全 缺陷 
的 应 用 程序 (例如 ， 在 端口 1434 上 监听 的 一 台 SOLMA RAW SRAM, RA | 
远程 用 户 能 在 易 受 攻击 的 主机 上 执行 任意 代码 ， 这 是 一 种 由 Slammer HH HAIRS | 
[ CERT 2003-04] ) ， 那 么 该 主机 已 成 为 攻击 者 的 可 中 之 物 了 。 

确定 哪个 应 用 程序 正在 监听 哪些 端口 是 一 件 相对 容易 的 事情 。 事 实 上 有 许多 公共 域 
程序 ( 称 为 端口 扫描 器 ) 做 的 正 是 这 种 事情 。 也 许 它 们 之 中 使 用 最 广泛 的 是 nmap， 该 程 | 




















Fp 4£ http ://nmap. org/ 上 免费 可 用 ， 并 且 包 括 在 大 多 数 Linux 分 发 软件 中 。 对 于 TCP，nmap 
顺序 地 扫描 端口 ， 寻 找 能 够 接受 TCP 连接 的 端口 。 对 于 UDP, nmap 也 是 顺序 地 扫描 端口 ， 
寻找 对 传输 的 UDP 报 文 段 进行 响应 的 UDP 端口 。 在 这 两 种 情况 下 ，nmap 返回 打开 的 、 关 
闭 的 或 不 可 达 的 端口 列表 。 运 行 nmap 的 主机 能 够 尝试 扫描 因特网 中 任何 地 方 的 目的 主机 。 
我 们 将 在 3.5.6 节 中 再 次 用 到 nmap， 在 该 节 中 我 们 将 讨论 TC 连接 管理 。 





图 3-5 图 示 了 这 种 情况 ， 图 中 主机 C 向 服务 器 B 发 起 了 两 个 HTTP 会 话 ， 主 机 A 向 服 
务 器 B 发 起 了 一 个 HTTP 会 话 。 主 机 A 与 主机 C 及 服务 器 B 都 有 自己 唯一 的 四 地 址 , € 
们 分 别 是 A、C、B。 主 机 C 为 其 两 个 HTTP 连接 分 配 了 两 个 不 同 的 源 端 口号 (26145 和 
7532) 。 因 为 主机 A 选择 源 端口 号 时 与 主机 C 互 不 相干 ， 因 此 它 也 可 以 将 源 端 口号 26145 
分 配给 其 HTTP 连接 。 但 这 不 是 问题 ， 即 服务 器 B 仍然 能 够 正确 地 分 解 这 两 个 具有 相同 源 
端口 号 的 连接 ， 因 为 这 两 条 连接 有 不 同 的 源 IP 地 址 。 


Web 客 户 每 个 连接 
主机 C Web 服 务 器 B HTTP 进 程 





图 3-5 两 个 客户 使 用 相同 的 目的 端口 号 〈80) 与 同一 个 Web 服务 器 应 用 通信 


3. Web 服务 器 与 TCP 

在 结束 这 个 讨论 之 前 ， 再 多 说 几 句 Web 服务 器 以 及 它们 如 何 使 用 端口 号 是 有 益 的 。 
考虑 一 台 运 行 Web 服务 器 的 主机 ， 例 如 在 端口 80 上 运行 一 个 Apache Web 服务 器 。 当 客户 
(如 浏览 器 ) 向 该 服务 器 发 送 报 文 段 时 ， 所 有 报 文 段 的 目的 端口 都 将 为 80。 特 别 是 ， 初 始 
连接 建立 报 文 段 和 承载 HTTP 请 求 的 报 文 段 都 有 80 的 目的 端口 。 如 我 们 刚才 描述 的 那样 ， 
该 服务 器 能 够 根据 源 卫 地 址 和 源 端 口号 来 区 分 来 自 不 同 客户 的 报 文 段 。 

3-5 显示 了 一 台 Web 服务 器 为 每 条 连接 生成 一 个 新 进程 。 如 图 3-5 所 示 ， 每 个 这 样 
的 进程 都 有 自己 的 连接 套 接 字 ， 通 过 这 些 套 接 字 可 以 收 到 HTTP 请 求 和 发 送 HTTP 响应 。 
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然而 ， 我 们 要 提 及 的 是 ， 连 接 套 接 字 与 进程 之 间 并 非 总 是 有 着 一 一 对 应 的 关系 。 事 实 上 ， 
当今 的 高 性 能 Web 服务 器 通常 只 使 用 一 个 进程 ,但 是 为 每 个 新 的 客户 连接 创建 一 个 具有 
新 连接 套 接 字 的 新 线程 。( 线程 可 被 看 作 是 一 个 轻 量 级 的 子 进程 ,) 如 果 做 了 第 2 章 的 第 一 
个 编程 作业 ， 你 所 构建 的 Web 服务 器 就 是 这 样 工 作 的 。 对 于 这 样 一 人 台 服 务 器 ， 在 任意 给 
定 的 时 间 内 都 可 能 有 (具有 不 同 标识 的 ) 许多 连接 套 接 字 连 接 到 相同 的 进程 。 

如 果 客 户 与 服务 器 使 用 持续 HTTP， 则 在 整 条 连接 持续 期 间 ， 客 户 与 服务 器 之 间 经 
同一 个 服务 器 套 接 字 交 换 HTTP 报 文 。 然 而 ， 如 果 客 户 与 服务 器 使 用 非 持 续 HTTP， 则 对 
每 一 对 请 求 /响应 都 创建 一 个 新 的 TCP 连接 并 在 随后 关闭 ， 因 此 对 每 一 对 请 求 /响应 创建 一 
个 新 的 套 接 字 并 在 随后 关闭 。 这 种 套 接 字 的 频繁 创建 和 关闭 会 严重 地 影响 一 个 繁忙 的 Web 
服务 器 的 性 能 (尽管 有 许多 操作 系统 技巧 可 用 来 减轻 这 个 问题 的 影响 ) 。 读 者 若 对 与 持续 
和 非 持续 HTTP 有 关 的 操作 系统 问题 感 兴趣 的 话 ， 可 参见 [Nielsen 1997, Nahum 2002 ] 。 

既然 我 们 已 经 讨论 过 了 运输 层 多 路 复 用 与 多 路 分 解 问题 ， 下 面 我 们 就 继续 讨论 因特网 
运输 层 协议 之 一 ， 即 UDP。 在 下 一 节 中 ,我 们 将 看 到 UDP 无 非 就 是 对 网 络 层 协议 增加 了 
一 点 〈 多 路 ) 复 用 /( 多 路 ) 分 解 服务 而 已 。 


3.3 无 连接 运输 : UDP 


在 本 节 中 ， 我 们 要 仔细 地 研究 一 下 UDP， 看 它 是 怎样 工作 的 ， 能 做 些 什么 。 我 们 鼓励 
你 回 过 来 看 一 下 2. 1 节 的 内 容 ， 其 中 包括 了 UDP 服务 模型 的 概述 ， 再 看 看 2.7. 1 节 ， 其 中 
讨论 了 UDP 上 的 套 接 字 编 程 。 

为 了 激发 我 们 讨论 UDP 的 热情 ， 假 如 你 对 设计 一 个 不 提供 不 必要 服务 的 最 简化 的 运 
输 层 协议 感 兴趣 。 你 将 打算 怎样 做 呢 ? 你 也 许 会 首先 考虑 使 用 一 个 无 所 事 事 的 运输 层 协 
议 。 特 别 是 在 发 送 方 一 人 出， 你 可 能 会 考虑 将 来 自 应 用 进程 的 数据 直接 交 给 网 络 层 ; 在 接收 
方 一 侧 ， 你 可 能 会 考虑 将 从 网 络 层 到 达 的 报 文 直接 交 给 应 用 进程 。 而 正如 我 们 在 前 一 节 所 
学 的 ， 我 们 必须 做 一 点 点 事 ， 而 不 是 什么 都 不 做 ! 运输 层 最 低 限 度 必须 提供 一 种 复 用 /分 
解 服务 ， 以 便 在 网 络 层 与 正确 的 应 用 级 进程 之 间 传 递 数据 。 

由 [RFC 768] 定义 的 UDP 只 是 做 了 运输 协议 能 够 做 的 最 少 工作 。 除 了 复 用 /分 解 功 
能 及 少量 的 差错 检测 外 ， 它 几乎 没有 对 IP 增加 别 的 东西 。 实 际 上 ， 如 果 应 用 程序 开发 人 
员 选 择 UDP 而 不 是 TCP， 则 该 应 用 程序 差不多 就 是 直接 与 打交道 。UDP 从 应 用 进程 得 
到 数据 ， 附 加 上 用 于 多 路 复 用 /分 解 服 务 的 源 和 目的 端口 号 字段 ， 以 及 两 个 其 他 的 小 字段 ， 
然后 将 形成 的 报 文 段 交 给 网 络 层 。 网 络 层 将 该 运输 层 报 文 段 封 装 到 一 个 IP RP, 2 
后 尽力 而 为 地 尝试 将 此 报 文 段 交 付 给 接收 主机 。 如 果 该 报 文 段 到 达 接 收 主机 ，UDP 使 用 目 
的 端口 号 将 报 文 段 中 的 数据 交付 给 正确 的 应 用 进程 。 值 得 注意 的 是 ,使 用 UDP 时 ， 在 发 
送 报 文 段 之 前 ， 发 送 方 和 接收 方 的 运输 层 实体 之 间 没 有 握手 。 正 因为 如 此 ，UDP 被 称 为 是 
无 连接 的 。 

DNS 是 一 个 通常 使 用 UDP 的 应 用 层 协 议 的 例子 。 当 一 台 主 机 中 的 DNS 应 用 程序 想 要 
进行 一 次 查询 时 ， 它 构造 了 一 个 DNS 查询 报 文 并 将 其 交 给 UDP。 无 须 执 行 任何 与 运行 在 
目的 端 系统 中 的 UDP 实体 之 间 的 握手 ， 主 机 端的 UDP 为 此 报 文 添加 首部 字段 ， 然 后 将 形 
成 的 报 文 段 交 给 网 络 层 。 网 络 层 将 此 UDP 报 文 段 封 装 进 一 个 人 数据 报 中 ， 然 后 将 其 发 送 
给 一 个 名 字 服 务 器 。 在 查询 主机 中 的 DNS 应 用 程序 则 等 待 对 该 查询 的 响应 。 如 果 它 没有 
收 到 响应 (可 能 是 由 于 底层 网 络 丢失 了 查询 或 响应 ) ， 则 要 么 试图 向 另 一 个 名 字 服 务 器 发 
送 该 查询 ， 要 么 通知 调用 的 应 用 程序 它 不 能 获得 响应 。 


现在 你 也 许 想 知道 ， 为 什么 应 用 开发 人 员 宁 愿 在 UDP 之 上 构建 应 用 ， 而 不 选择 在 TCP 
上 构建 应 用 ? 既然 TCP 提供 了 可 靠 数据 传输 服务 ， 而 UDP 不 能 提供 ， 那 么 TCP 是 否 总 是 
首选 的 呢 ? 答案 是 否定 的 ， 因 为 有 许多 应 用 更 适合 用 UDP, 原因 主要 以 下 几 点 : 

© 关于 发 送 什么 数据 以 及 何 时 发 送 的 应 用 层 控 制 更 为 精细 。 采 用 UDP 时 ， 只 要 应 用 

进程 将 数据 传递 给 UDP, UDP 就 会 将 此 数据 打包 进 UDP 报 文 段 并 立即 将 其 传递 给 
网 络 层 。 在 另 一 方面 ，TCP 有 一 个 拥塞 控制 机 制 ， 以 便当 源 和 目的 主机 间 的 一 条 
或 多 条 链 路 变 得 极度 拥塞 时 来 遏制 运输 层 TCP 发 送 方 。TCP 仍 将 继续 重新 发 送 数 
据 报 文 段 直到 目的 主机 收 到 此 报 文 并 加 以 确认 ， 而 不 管 可 靠 交 付 需要 用 多 长 时 间 。 
因为 实时 应 用 通常 要 求 最 小 的 发 送 速率 ， 不 希望 过 分 地 延迟 报 文 段 的 传送 ， 且 能 
容忍 一 些 数据 丢失 ，TCP 服务 模型 并 不 是 特别 适合 这 些 应 用 的 需要 。 如 后 面 所 讨 
论 的 ， 这 些 应 用 可 以 使 用 UDP， 并 作为 应 用 的 一 部 分 来 实现 所 需 的 、 超 出 UDP 的 
不 提供 不 必要 的 报 文 段 交 付 服务 之 外 的 额外 功能 。 

。 无 须 连 接 建立 。 如 我 们 后 面 所 讨论 的 ，TCP 在 开始 数据 传输 之 前 要 经 过 三 次 握手 。 
UDP 却 不 需要 任何 准备 即 可 进行 数据 传输 。 因 此 UDP 不 会 引入 建立 连接 的 时 延 。 
这 可 能 是 DNS 运行 在 UDP 之 上 而 不 是 运行 在 TCP 之 上 的 主要 原因 (如 果 运 行 在 
TCP E, W DNS 会 慢 得 多 ) HTTP 使 用 TCP 而 不 是 UDP， 因 为 对 于 具有 文本 数据 
的 Web 网 页 来 说 ， 可 靠 性 是 至 关 重 要 的 。 但 是 ， 如 我 们 在 2.2 节 中 简要 讨论 的 那 
PE, HTTP 中 的 TCP 连接 建立 时 延 对 于 与 下 载 Web 文档 相关 的 时 延 来 说 是 一 个 重 
要 因素 。 用 于 谷歌 的 Chrome 浏览 器 中 的 QUIC 协议 (快速 UDP 因特网 连接 [Iyen- 
gar 2015]) 将 UDP 作为 其 支撑 运输 协议 并 在 UDP 之 上 的 应 用 层 协议 中 实现 可 
靠 性 。 

© 无 连接 状态 。TCP 需要 在 端 系统 中 维护 连接 状态 。 此 连接 状态 包括 接收 和 发 送 缓存 、 
拥塞 控制 参数 以 及 序号 与 确认 号 的 参数 。 我 们 将 在 3. 5 节 看 到 ， 要 实现 TCP 的 可 靠 
数据 传输 服务 并 提供 拥塞 控制 ， 这 些 状 态 信息 是 必要 的 。 另 一 方面 ，UDP 不 维护 连 
接 状态 ， 也 不 跟踪 这 些 参数 。 因 此 ， 某 些 专门 用 于 某 种 特定 应 用 的 服务 器 当 应 用 程 
序 运行 在 UDP 之 上 而 不 是 运行 在 TCP 上 时 ， 一 般 都 能 支持 更 多 的 活跃 客户 。 

© 分 组 首部 开销 小 。 每 个 TCP 报 文 段 都 有 20 字 节 的 首部 开销 ,而 UDP 仅 有 8 字 节 
的 开销 。 

图 3-6 列 出 了 流行 的 因特网 应 用 及 其 所 使 用 的 运输 协议 。 如 我 们 所 期 望 的 那样 ， 电 子 
邮件 、 远 程 终端 访问 、Web 及 文件 传输 都 运行 在 TCP 之 上 。 因 为 所 有 这 些 应 用 都 需要 TCP 
的 可 靠 数据 传输 服务 。 无 论 如 何 ， 有 很 多 重要 的 应 用 是 运行 在 UDP 上 而 不 是 TCP 上 。 例 
如 ，UDP 用 于 承载 网 络 管理 数据 (SNMP， 参 见 5.7 节 )。 在 这 种 场合 下 ，UDP 要 优 于 
TCP， 因 为 网 络 管理 应 用 程序 通常 必须 在 该 网 络 处 于 重 压 状态 时 运行 ， 而 正 是 在 这 个 时 候 
可 靠 的 、 拥 塞 受 控 的 数据 传输 难以 实现 。 此 外 ， 如 我 们 前 面 所 述 ， RS 运行 在 UDP 之 上 ， 
从 而 避免 了 TCP 的 连接 创建 时 延 。 

如 图 3-6 所 示 ，UDP Ail TCP 现在 都 用 于 多 媒体 应 用 ， 如 因特网 电话 、 实 时 视频 会 议 、 
流 式 存储 音频 与 视频 。 我 们 将 在 第 9 章 仔细 学 习 这 些 应 用 。 我 们 刚 说 过 ， 既 然 所 有 这 些 应 
用 都 能 容忍 少量 的 分 组 丢失 ， 因 此 可 靠 数 据 传输 对 于 这 些 应 用 的 成 功 并 不 是 至 关 重 要 的 。 
此 外 ，TCP 的 拥塞 控制 会 导致 如 因特网 电话 、 视 频 会 议 之 类 的 实时 应 用 性 能 变 得 很 差 。 由 
于 这 些 原因 ， 多 媒体 应 用 开发 人 员 通 常 将 这 些 应 用 运行 在 UDP 之 上 而 不 是 TCP 之 上 。 当 
分 组 丢 包 率 低 时 ， 并且 为 了 安全 原因 ， 某 些 机 构 阻 塞 UDP 流量 (参见 第 8 章 ) ， 对 于 流 式 
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媒体 传输 来 说 ，TCP 变 得 越 来 越 有 吸引 力 了 。 


电子 邮件 
远程 终端 访问 


Web 
ae 
a O 
UDP ak TCP 

Ex ee 通常 UDP 


图 3-6 流行 的 因特网 应 用 及 其 下 面 的 运输 协议 


虽然 目前 通常 这 样 做 ， 但 在 UDP 之 上 运行 多 媒体 应 用 是 有 争议 的 。 如 我 们 前 面 所 述 ， 
UDP 没有 拥塞 控制 。 但 是 ， 需 要 拥塞 控制 来 预防 网 络 进 入 一 种 拥塞 状态 ， 在 拥塞 状态 中 可 
做 的 有 用 工作 非常 少 。 如 果 每 个 人 都 启动 流 式 高 比特 率 视频 而 不 使 用 任何 拥塞 控制 的 话 ， 
就 会 使 路 由 器 中 有 大 量 的 分 组 溢出 ， 以 至 于 非常 少 的 UDP 分 组 能 成 功 地 通过 源 到 目的 的 
路 径 传输 。 况 且 ， 由 无 控制 的 UDP 发 送 方 引入 的 高 丢 包 率 将 引起 TCP 发 送 方 ( 如 我 们 将 
看 到 的 那样 ，TCP 遇 到 拥塞 将 减 小 它们 的 发 送 速率 ) 大 大 地 减 小 它们 的 速率 。 因 此 ，UDP 
中 缺乏 拥塞 控制 能 够 导致 UDP 发 送 方 和 接收 方 之 间 的 高 丢 包 率 ， 并 挤 垮 了 TCP 会 话 ， 这 
是 一 个 潜在 的 严重 问题 [Floyd 1999 ] 。 很 多 研究 人 员 已 提出 了 一 些 新 机 制 ， 以 促使 所 有 的 
数据 源 (包括 UDP W) 执行 自 适 应 的 拥塞 控制 [ Mahdavi 1997; Floyd 2000; Kohler 2006; 
RFC 4340 ] 。 

在 讨论 UDP 报 文 段 结 构 之 前 ， 我 们 要 提 一 下 ， 使 用 UDP 的 应 用 是 可 能 实现 可 靠 数 据 
传输 的 。 这 可 通过 在 应 用 程序 自身 中 建立 可 靠 性 机 制 来 完成 (例如 ， 可 通过 增加 确认 与 重 
传 机 制 来 实现 ， 如 采用 我 们 将 在 下 一 节 学 习 的 一 些 机 制 ) 。 我 们 前 面 讲 过 在 谷歌 的 Chrome 
浏览 器 中 所 使 用 的 QUIC 协议 [Iyengar 2015] 在 UDP 之 上 的 应 用 层 协 议 中 实现 了 可 靠 性 。 
但 这 并 不 是 无 足 轻重 的 任务 ， 它 会 使 应 用 开发 人 员 长 时 间 地 忙于 调试 。 无 论 如 何 ， 将 可 靠 
性 直接 构建 于 应 用 程序 中 可 以 使 其 “左右 着 源 ”"。 也 就 是 说 应 用 进程 可 以 进行 可 靠 通信 ， 
而 无 须 受制 于 由 TCP 拥塞 控制 机 制 强加 的 传输 速率 限制 。 
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3.3.1 UDP 报 文 段 结构 | ne i | 

UDP 报 文 段 结构 如 图 3-7 所 示 ， 它 由 RFC 768 EN. E | mng | Rng 
用 层 数 据 占用 UDP 报 文 段 的 数据 字段 。 例 如 ,对 于 DNS 应 ge 
用 ， 数 据 字 段 要 么 包含 一 个 查询 报 文 ， 要 么 包含 一 个 响应 报 == = = 


文 。 对 于 流 式 音频 应 用 ， 音 频 抽样 数据 填充 到 数据 字段 。 RSNXRAA O 
UDP 首部 只 有 4 个 字段 ， 每 个 字段 由 两 个 字 节 组 成 。 如 前 一 。VD SX) 
节 所 讨论 的 ， 通 过 端口 号 可 以 使 目的 主机 将 应 用 数据 交 给 运 

行 在 目的 端 系统 中 的 相应 进程 〈《 即 执行 分 解 功 能 ) 。 长 度 字段 。 图 3-7” UDP 报 文 段 结构 
指示 了 在 UDP 报 文 段 中 的 字 节 数 (首部 加 数据 ) 。 因 为 数据 字段 的 长 度 在 一 个 UDP 段 中 
不 同 于 在 另 一 个 段 中 ， 故 需要 一 个 明确 的 长 度 。 接 收 方 使 用 检验 和 来 检查 在 该 报 文 段 中 是 





否 出 现 了 差错 。 实 际 上 ， 计 算 检 验 和 时 ， 除 了 UDP 报 文 段 以 外 还 包括 了 IP 首部 的 一 些 字 
段 。 但 是 我 们 忽略 这 些 细节 ， 以 便 能 从 整体 上 看 问题 。 下 面 我 们 将 讨论 检验 和 的 计算 。 在 
6.2 节 中 将 描述 差错 检测 的 基本 原理 。 长 度 字段 指明 了 包括 首部 在 内 的 UDP 报 文 段 长 度 
(以 字 节 为 单位 ) 。 


3.3.2 UDP 检验 和 


UDP 检验 和 提供 了 差错 检测 功能 。 这 就 是 说 ， 检 验 和 用 于 确定 当 UDP 报 文 段 从 源 到 
达 目 的 地 移动 时 ， 其 中 的 比特 是 否 发 生 了 改变 〈 例 如 ， 由 于 链 路 中 的 噪声 干扰 或 者 存储 在 
路 由 器 中 时 引入 问题 ) 。 发 送 方 的 UDP 对 报 文 段 中 的 所 有 16 比特 字 的 和 进行 反 码 运算 ， 
求 和 时 遇 到 的 任何 溢出 都 被 回 卷 。 得 到 的 结果 被 放 在 UDP 报 文 段 中 的 检验 和 字段 。 下 面 
给 出 一 个 计算 检验 和 的 简单 例子 。 在 RFC 1071 中 可 以 找到 有 效 实现 的 细节 ， 还 可 在 
[Stone 1998; Stone 2000] 中 找到 它 处 理 真实 数据 的 性 能 。 举 例 来 说 ， 假 定 我 们 有 下 面 3 
个 16 比特 的 字 : 
0110011001100000 
0101010101010101 
1000111100001100 
这 些 16 比特 字 的 前 两 个 之 和 是 : 
0110011001100000 
0101010101010101 


1011101110110101 
再 将 上 面 的 和 与 第 三 个 字 相 加 ， 得 出 : 
1011101110110101 
1000111100001100 
0100101011000010 
注意 到 最 后 一 次 加 法 有 溢出 ， 它 要 被 回 卷 。 反 码 运算 就 是 将 所 有 的 0 换 成 1， 所 有 的 
1 转换 成 0。 因 此 ， 该 和 0100101011000010 的 反 码 运算 结果 是 1011010100111101， 这 就 变 
为 了 检验 和 。 在 接收 方 ， 全 部 的 4 个 16 比特 字 (包括 检验 和 ) 加 在 一 起 。 如 果 该 分 组 中 
没有 引入 差错 ， 则 显然 在 接收 方 处 该 和 将 是 1111111111111111。 如 果 这 些 比特 之 一 是 0， 
那么 我 们 就 知道 该 分 组 中 已 经 出 现 了 差错 。 
你 可 能 想 知道 为 什么 UDP 首先 提供 了 检验 和 ， 就 像 许多 链 路 层 协议 (包括 流行 的 以 
太 网 协议 ) 也 提供 了 差错 检测 那样 。 其 原因 是 不 能 保证 源 和 目的 之 间 的 所 有 链 路 都 提供 差 
错 检测 ; 这 就 是 说 ， 也 许 这 些 链 路 中 的 一 条 可 能 使 用 没有 差错 检测 的 协议 。 此 外 ， 即 使 报 
文 段 经 链 路 正确 地 传输 ， 当 报 文 段 存储 在 某 台 路 由 器 的 内 存 中 时 ， 也 可 能 引入 比特 差错 。 
在 既 无 法 确保 逐 链 路 的 可 靠 性 ， 又 无 法 确保 内 存 中 的 差错 检测 的 情况 下 ， 如 果 端 到 端 数 据 
传输 服务 要 提供 差错 检测 ，UDP 就 必须 在 端 到 端 基础 上 在 运输 层 提 供 差 错 检 测 。 这 是 一 个 
在 系统 设计 中 被 称颂 的 端 到 端 原则 (end-end principle) 的 例子 [Saltzer 1984] ， 该 原则 表 
述 为 因为 某 种 功能 (在 此 时 为 差错 检测 ) 必须 基于 端 到 端 实现 : “与 在 较 高 级 别提 供 这 些 
功能 的 代价 相 比 ， 在 较 低级 别 上 设置 的 功能 可 能 是 元 余 的 或 几乎 没有 价值 的 。” 
因为 假定 IP 是 可 以 运行 在 任何 第 二 层 协议 之 上 的 ， 运输 层 提供 差错 检测 作为 一 种 保 
险 措施 是 非常 有 用 的 。 虽 然 UDP 提供 差错 检测 ， 但 它 对 差错 恢复 无 能 为 力 。UDP 的 某 种 
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实现 只 是 丢弃 受 损 的 报 文 段 ; 其 他 实现 是 将 受 损 的 报 文 段 交 给 应 用 程序 并 给 出 警告 。 

至 此 结束 了 关于 UDP 的 讨论 。 我 们 将 很 快 看 到 TCP 为 应 用 提供 了 可 靠 数据 传输 及 
UDP 所 不 能 提供 的 其 他 服务 。TCP 自然 要 比 UDP 复杂 得 多 。 然 而 ， 在 讨论 TCP 之 前 ,我 
们 后 退 一 步 ， 先 来 讨论 一 下 可 靠 数 据 传 输 的 基本 原理 是 有 用 的 。 


3.4 可 靠 数 据 传输 原理 


在 本 节 中， 我 们 在 一 般 场 景 下 考虑 可 靠 数据 传输 的 问题 。 因 为 可 靠 数据 传输 的 实现 问 
题 不 仅 在 运输 层 出 现 ， 也 会 在 链 路 层 以 及 应 用 层 出 现 ， 这 时 讨论 它 是 恰当 的 。 因 此 ， 一 般 
性 问题 对 网 络 来 说 更 为 重要 。 如 果 的 确 要 将 所 有 网 络 中 最 为 重要 的 “前 10 个 ”问题 排名 
的 话 ， 可 靠 数 据 传输 将 是 名 列 榜首 的 候选 者 。 在 下 一 节 中 ， 我们 将 学 习 TCP， 尤 其 要 说 明 
TCP 所 采用 的 许多 原理 ， 而 这 些 正 是 我 们 打算 描述 的 内 容 。 

图 3-8 图 示 说 明了 我 们 学 习 可 靠 数据 传输 的 框架 。 为 上 层 实 体 提 供 的 服务 抽象 是 : 数 
据 可 以 通过 一 条 可 靠 的 信道 进行 传输 。 借 助 于 可 靠 信道 ， 传 输 数据 比特 就 不 会 受到 损坏 
(由 0 变 为 1, 或 者 相反 ) 或 丢失 ， 而 且 所 有 数据 都 是 按照 其 发 送 顺 序 进行 交付 。 这 恰好 
就 是 TCP 向 调用 它 的 因特网 应 用 所 提供 的 服务 模型 。 
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图 3-8 可 靠 数据 传输 : 服务 模型 与 服务 实现 


实现 这 种 服务 抽象 是 可 靠 数据 传输 协议 (reliable data transfer protocol) 的 责任 。 由 于 
可 靠 数据 传输 协议 的 下 层 协议 也 许 是 不 可 靠 的 ， 因 此 这 是 一 项 困难 的 任务 。 例 如 ，TCP 是 
FEAR AT SEAS CIP) 端 到 端 网 络 层 之 上 实现 的 可 靠 数 据 传输 协议 。 更 一 般 的 情况 是 ， 两 个 可 
靠 通信 端点 的 下 层 可 能 是 由 一 条 物理 链 路 〈 如 在 链 路 级 数据 传输 协议 的 场合 下 ) 组 成 或 是 
由 一 个 全 球 互联 网 络 〈 如 在 运输 级 协议 的 场合 下 ) 组 成 。 然 而 ， 就 我 们 的 目的 而 言 ， 我 们 





可 将 较 低 层 直 接 视 为 不 可 靠 的 点 对 点 信道 。 

在 本 节 中 ， 考 虑 到 底层 信道 模型 越 来 越 复杂 ， 我 们 将 不 断 地 开发 一 个 可 靠 数 据 传输 协 
议 的 发 送 方 一 侧 和 接收 方 一 侧 。 例 如 ， 我 们 将 考虑 当 底 层 信道 能 够 损坏 比特 或 丢失 整个 分 
组 时 ， 需 要 什么 样 的 协议 机 制 。 这 里 贯穿 我 们 讨论 始终 的 一 个 假设 是 分 组 将 以 它们 发 送 的 
次 序 进行 交付 ， 某 些 分 组 可 能 会 丢失 ; 这 就 是 说 ， 底 层 信 道 将 不 会 对 分 组 重 排序 。 图 3-8b 
图 示 说 明了 用 于 数据 传输 协议 的 接口 。 通 过 调用 rdt_send() 函数 ， 上 层 可 以 调用 数据 传输 
协议 的 发 送 方 。 它 将 要 发 送 的 数据 交付 给 位 于 接收 方 的 较 高 层 。( 这 里 rdt 表示 可 靠 数据 传 
给 协议 ，_send 指示 rdt 的 发 送 端正 在 被 调用 。 开 发 任何 协议 的 第 一 步 就 是 要 选择 一 个 好 的 
名 字 !) 在 接收 端 ， 当 分 组 从 信道 的 接收 端 到 达 时 ， 将 调用 rdt_rev() 。 当 rdt 协议 想 要 向 较 
高 层 交 付 数 据 时 ， 将 通过 调用 deliver_data() 来 完成 。 后 面 ， 我 们 将 使 用 术语 “分 组 ”而 不 
用 运输 层 的 “ 报 文 段 ”"。 因 为 本 节 研 讨 的 理论 适用 于 一 般 的 计算 机 网 络 ， 而 不 只 是 用 于 因 
特 网 运输 层 ， 所 以 这 时 采用 通用 术语 “分 组 ”也 许 更 为 合适 。 

EAP, 我们 仅 考 虑 单 向 数据 传输 (unidirectional data transfer) 的 情况 ， 即 数据 传 
输 是 从 发 送 端 到 接收 端的 。 可 靠 的 双向 数据 传输 (bidirectional data transfer) ( 即 全 双 工 数 
据 传输 ) 情况 从 概念 上 讲 不 会 更 难 ， 但 解释 起 来 更 为 单调 乏味 。 虽 然 我 们 只 考虑 单 向 数据 
传输 ， 注 意 到 下 列 事实 是 重要 的 ， 我 们 的 协议 也 需要 在 发 送 端 和 接收 端 两 个 方向 上 传输 分 
组 ， 如 图 3-8 所 示 。 我 们 很 快 会 看 到 ， 除 了 交换 含有 待 传送 的 数据 的 分 组 之 外 ，rdt 的 发 送 
端 和 接收 端 还 需 往 返 交 换 控制 分 组 。rdt 的 发 送 端 和 接收 端 都 要 通过 调用 udt_send() 发 送 分 
组 给 对 方 ( 其 中 udt 表示 不 可 靠 数据 传输 )。 


3.4.1 构造 可 靠 数据 传输 协议 

我 们 现在 一 步 步 地 研究 一 系列 协议 ， 它 们 一 个 比 一 个 更 为 复杂 ， 最 后 得 到 一 个 完美 、 
可 靠 的 数据 传输 协议 。 

1. 经 完全 可 靠 信道 的 可 靠 数据 传输 : rdt1. 0 


首先 ， 我 们 考虑 最 简单 的 情况 ， 即 底层 信道 是 完全 可 靠 的 。 我 们 称 该 协议 为 rdtl. 0, 
该 协议 本 身 是 简单 的 。 图 3-9 显示 了 rdtl. 0 发 送 方 和 接收 方 的 有 限 状 态 机 (Finite- State 
Machine, FSM) 的 定义 。 图 3-9a 中 的 FSM ~ 


定义 了 发 送 方 的 操作 ， 图 3-9b 中 的 FSM 定 `a ES ait 
义 了 接收 方 的 操作 。 注 意 到 下 列 问题 是 重要 EE e\o 
的 ， 发 送 方 和 接收 方 有 各 自 的 FSM, A 3-9 ERRAN BAN pan lye 


中 发 送 方 和 接收 方 的 FSM 每 个 都 只 有 一 个 状 
态 。FSM 描述 图 中 的 箭头 指示 了 协议 从 一 个 
状态 变迁 到 男 一 个 状态 。( 因为 图 3-9 中 的 每 人、 


a) rdt1.0: 发 送 端 


个 FSM 都 只 有 一 个 状态 ， 因 此 变迁 必定 是 从 Dea 
一 个 状态 返回 到 自身 ; 我 们 很 快 将 看 到 更 复 As 
杂 的 状态 图 。) 引起 变迁 的 事件 显示 在 表示 

变迁 的 横 线 上 方 ， 事 件 发 生 时 所 采取 的 动作 b) rdtl.0: 接收 端 


显示 在 横 线 下 方 。 如 果 对 一 个 事件 没有 动作 ， 图 3-9 zrdtl. 0， 用 于 完全 可 靠 信道 的 协议 
或 没有 就 事件 发 生 而 采取 了 一 个 动作 ， 我 们 
将 在 横 线 上 方 或 下 方 使 用 符号 A， 以 分 别 明确 地 表示 缺少 动作 或 事件 。FSM 的 初始 状态 用 
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虚线 表示 。 尽 管 图 3-9 中 的 FSM 只 有 一 个 状态 ， 但 马上 我 们 就 将 看 到 多 状态 的 FSM， 因 此 
标识 每 个 FSM 的 初始 状态 是 非常 重要 的 。 
rdt 的 发 送 端 只 通过 rdt_send( data) 事件 接受 来 自 较 高 层 的 数据 ， 产 生 一 个 包含 该 数据 
的 分 组 (经 由 make_pkt(data) 动作 ) ， 并 将 分 组 发 送 到 信道 中 。 实 际 上 ，rdt_send( data) 事 
件 是 由 较 高 层 应 用 的 过 程 调用 产生 的 (例如 ,，rdt_send() ) 。 
在 接收 端 ，rdt 通过 rdt_rev( packet) 事件 从 底层 信道 接收 一 个 分 组 ， 从 分 组 中 取出 数据 
(经 由 extract(packet，data) 动作 )， 并 将 数据 上 传 给 较 高 层 (通过 deliver_data( data) 动作 ) o 
实际 上 ，rdt_rev( packet) 事件 是 由 较 低 层 协 议 的 过 程 调用 产生 的 (例如 ，rdt_rev() ) 。 
在 这 个 简单 的 协议 中 ， 一 个 单元 数据 与 一 个 分 组 没 差别 。 而 且 ， 所 有 分 组 是 从 发 送 方 
流向 接收 方 ， 有 了 完全 可 靠 的 信道 ， 接 收 端 就 不 需要 提供 任何 反馈 信息 给 发 送 方 ， 因 为 不 
必 担 心 出 现 差错 ! 注意 到 我 们 也 已 经 假定 了 接收 方 接收 数据 的 速率 能 够 与 发 送 方 发 送 数据 
的 速率 一 样 快 。 因 此 ， 接 收 方 没 有 必要 请 求 发 送 方 慢 一 点 ! 
2. 经 具有 比特 差错 信道 的 可 靠 数据 传输 : rdt2.0 
底层 信道 更 为 实际 的 模型 是 分 组 中 的 比特 可 能 受 损 的 模型 。 在 分 组 的 传输 、 传 播 或 组 
存 的 过 程 中 ， 这 种 比特 差错 通常 会 出 现在 网 络 的 物理 部 件 中 。 我 们 眼下 还 将 继续 假定 所 有 
发 送 的 分 组 (虽然 有 些 比特 可 能 受 损 ) 将 按 其 发 送 的 顺序 被 接收 。 
在 研发 一 种 经 这 种 信道 进行 可 靠 通信 的 协议 之 前 ,首先 考虑 一 下 人 们 会 怎样 处 理 这 类 
情形 。 考 虑 一 下 你 自己 是 怎样 通过 电话 口述 一 条 长 报 文 的 。 在 通常 情况 下 ， 报 文 接收 者 在 
听 到 、 理 解 并 记 下 每 句 话 后 可 能 会 说 “OK”。 如 果 报 文 接 收 者 听 到 一 句 含糊 不 清 的 话 时 ， 
他 可 能 要 求 你 重复 那 句 容易 误解 的 话 。 这 种 口述 报 文 协 议 使 用 了 肯定 确认 (positive ac- 
knowledgment) (“OK”) 与 否定 确认 (negative acknowledgment) (“请 重复 一 遍 ”)。 这 些 
控制 报 文 使 得 接收 方 可 以 证 发 送 方 知道 哪些 内 容 被 正确 接收 ， 哪 些 内 容 接收 有 误 并 因此 需 
要 重复 。 在 计算 机 网 络 环境 中 ， 基 于 这 样 重 传 机 制 的 可 靠 数据 传输 协议 称 为 自动 重 传 请 求 
(Automatic Repeat reQuest，ARQ) 协议 。 
重要 的 是 ，ARQ 协议 中 还 需要 另外 三 种 协议 功能 来 处 理 存在 比特 差错 的 情况 : 
e 差错 检测 。 首 先 ， 需要 一 种 机 制 以 使 接收 方 检测 到 何 时 出 现 了 比特 差错 。 前 一 节 
讲 到 ，UDP 使 用 因特网 检验 和 字段 正 是 为 了 这 个 目的 。 在 第 5 RP, 我们 将 更 详 
细 地 学 习 差 错 检测 和 纠 错 技 术 。 这 些 技术 使 接收 方 可 以 检测 并 可 能 纠正 分 组 中 的 
比特 差错 。 此 刻 ， 我 们 只 需 知道 这 些 技 术 要 求 有 额外 的 比特 (除了 待 发 送 的 初始 
数据 比特 之 外 的 比特 ) 从 发 送 方 发 送 到 接收 方 ; 这 些 比特 将 被 汇集 在 rdt2.0 数据 
分 组 的 分 组 检验 和 字段 中 。 

© 接收 方 反馈 。 因 为 发 送 方 和 接收 方 通常 在 不 同 端 系统 上 执行 ， 可 能 相隔 数 千 英里 ， 
发 送 方 要 了 解 接收 方 情 况 〈 此 时 为 分 组 是 否 被 正确 接收 ) 的 唯一 途径 就 是 让 接收 
方 提供 明确 的 反馈 信息 给 发 送 方 。 在 口述 报 文 情 况 下 回答 的 “肯定 确认 ” (ACK) 
和 “否定 确认 ”(NAK) 就 是 这 种 反馈 的 例子 。 类 似 地 ， 我 们 的 rdt2. 0 协议 将 从 
接收 方向 发 送 方 回 送 ACK 与 NAK 分 组 。 理 论 上 ， 这 些 分 组 只 需要 一 个 比特 长 ; 
如 用 0 表示 NAK, 用 1 表示 ACK, 

e 重 传 。 接 收 方 收 到 有 差错 的 分 组 时 ， 发 送 方 将 重 传 该 分 组 文 。 

图 3-10 说 明了 表示 rdt2.0 的 FSM， 该 数据 传输 协议 采用 了 差错 检测 、 肯 定 确认 与 否 
定 确认 。 





rdt_send (data) 


sndpkt=make_pkt (data, checksum) 
udt_send(sndpkt) 
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自 4 hpa rdt, TAKEN EPKEN re arn KENNI && isNAK (rcvpkt) 
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rdt_rcv(revpkt) && isACK (rcvpkt) 
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a) rdt2.0: 发 送 端 


rdt_rcv (revpkt) && corrupt (rcvpkt) 


sndpkt=make_pkt (NAK) 
PS udt_send (sndpkt) 
~ 
` 


~ 


等 竺 来自 
下 层 的 调用 


a rdt_rcv (ICVPKt) && notcorrupt (rcvpkt) 


extract (rcvpkt, data) 
deliver_data (data) 
sndpkt=make_pkt (ACK) 
udt_send (sndpkt) 


b) rdt2.0: 接收 端 
图 3-10 rdt2.0; 用 于 具有 比特 差错 信道 的 协议 


rdt2.0 的 发 送 端 有 两 个 状态 。 在 最 左边 的 状态 中 ， 发 送 端 协议 正 等 待 来 自 上 层 传 下 来 
的 数据 。 当 rdt_send( data) 事件 出 现时 ， 发 送 方 将 产生 一 个 包含 待 发 送 数据 的 分 组 ( sndp- 
kt) ， 带 有 检验 和 (例如 ， 就 像 在 3.3.2 节 讨 论 的 对 UDP 报 文 段 使 用 的 方法 ) ， 然 后 经 由 
udt_send( sndpkt) 操作 发 送 该 分 组 。 在 最 右边 的 状态 中 ， 发 送 方 协议 等 待 来 自 接 收 方 的 
ACK 或 NAK 分 组 。 如 果 收 到 一 个 ACK 分 组 (图 3- 10 中 符号 rdt_rev(revpkt) && isACK 
(revpkt) 对 应 该 事件 ) ， 则 发 送 方 知道 最 近 发 送 的 分 组 已 被 正确 接收 ， 因 此 协议 返回 到 等 
待 来 自 上 层 的 数据 的 状态 。 如 果 收 到 一 个 NAK 分 组 ， 该 协议 重 传 上 一 个 分 组 并 等 待 接收 
方 为 响应 重 传 分 组 而 回 送 的 ACK 和 NAK。 注 意 到 下 列 事实 很 重要 : 当 发 送 方 处 于 等 待 
ACK 或 NAK 的 状态 时 ， 它 不 能 从 上 层 获得 更 多 的 数据 ; 这 就 是 说 ，rdt_send() 事件 不 可 能 
出 现 ; 仅 当 接收 到 ACK 并 离开 该 状态 时 才能 发 生 这 样 的 事件 。 因 此 ， 发 送 方 将 不 会 发 送 
一 块 新 数据 ， 除 非 发 送 方 确信 接收 方 已 正确 接收 当前 分 组 。 由 于 这 种 行为 ，rdt2. 0 这 样 的 
协议 被 称 为 停 等 (stop-and-wait) 协议 。 

rdt2. 0 接收 方 的 FSM 仍然 只 有 单一 状态 。 当 分 组 到 达 时 ， 接 收 方 要 么 回答 一 个 ACK， 要 
么 回答 一 个 NAK， 这 取决 于 收 到 的 分 组 是 否 受 损 。 在 图 3- 10 中 ,符号 rdt_rcv(rcvpkt) && 
corrupt( revpkt) 对 应 于 收 到 一 个 分 组 并 发 现 有 错 的 事件 。 
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rdt2. 0 协议 看 起 来 似乎 可 以 运行 了 ,但 遗憾 的 是 ， 它 存在 一 个 致命 的 缺陷 。 尤 其 是 我 
们 没有 考虑 到 ACK 或 NAK 分 组 受 损 的 可 能 性 ! (在 继续 研究 之 前 ， 你 应 该 考虑 怎样 解决 
该 问题 。) 遗憾 的 是 ， 我 们 细小 的 疏忽 并 非 像 它 看 起 来 那么 无 关 紧 要 。 至 少 ， 我 们 需要 在 
ACK/NAK 分 组 中 添加 检验 和 比特 以 检测 这 样 的 差错 。 更 难 的 问题 是 协议 应 该 怎样 纠正 
ACK 或 NAK 分 组 中 的 差错 。 这 里 的 难点 在 于 ， 如 果 一 个 ACK 或 NAK 分 组 受 损 ， 发 送 方 
无 法 知道 接收 方 是 否 正确 接收 了 上 一 块 发 送 的 数据 。 

考虑 处 理 受 损 ACK 和 NAK 时 的 3 种 可 能 性 : 

e 对 于 第 一 种 可 能 性 ， 考 虑 在 口述 报 文 情况 下 人 可 能 的 做 法 。 如 果 说 话 者 不 理解 来 

自 接收 方 回答 的 “OK” 或 “请 重复 一 遍 ”， 说 话 者 将 可 能 问 “ 你 说 什么 ?”( 因此 
在 我 们 的 协议 中 引入 了 一 种 新 型 发 送 方 到 接收 方 的 分 组 )。 接 收 方 则 将 复述 其 回 
答 。 但 是 如 果 说 话 者 的 “你 说 什么 ?” 产 生 了 差错 ， 人 情况 又 会 怎样 呢 ? 接收 者 不 明 
白 那 句 混 淆 的 话 是 口述 内 容 的 一 部 分 还 是 一 个 要 求 重 复 上 次 回答 的 请 求 ， 很 可 能 
回 一 名 “你 说 什么 ?”。 于 是 ,该 回答 可 能 含糊 不 清 了 。 显 然 ， 我 们 走 上 了 一 条 困 
难 重重 之 路 。 

e 第 二 种 可 能 性 是 增加 足够 的 检验 和 比特 ， 使 发 送 方 不 仅 可 以 检测 差错 ， 还 可 恢复 

差错 。 对 于 会 产生 差错 但 不 丢失 分 组 的 信道 ， 这 就 可 以 直接 解决 问题 。 

© 第 三 种 方法 是 ， 当 发 送 方 收 到 含糊 不 清 的 ACK 或 NAK 分 组 时 ， 只 需 重 传 当 前 数 

据 分 组 即 可 。 然 而 ， 这 种 方法 在 发 送 方 到 接收 方 的 信道 中 引入 了 宛 余 分 组 ( dupli- 
cate packet) 。 宛 余 分 组 的 根本 困难 在 于 接收 方 不 知道 它 上 次 所 发 送 的 ACK 或 NAK 
是 否 被 发 送 方正 确 地 收 到 。 因 此 它 无 法 事先 知道 接收 到 的 分 组 是 新 的 还 是 一 次 
重 传 ! 

解决 这 个 新 问题 的 一 个 简单 方法 (几乎 所 有 现 有 的 数据 传输 协议 中 ， 包 括 TCP， 都 采 
用 了 这 种 方法 ) 是 在 数据 分 组 中 添加 一 新 字段 ， 让 发 送 方 对 其 数据 分 组 编号 ， 即 将 发 送 数 
据 分 组 的 序号 (sequence number) 放 在 该 字段 。 于 是 ,接收 方 只 需要 检查 序号 即 可 确定 收 
到 的 分 组 是 否 一 次 重 传 。 对 于 停 等 协议 这 种 简单 情况 ，1 比特 序号 就 足够 了 ， 因 为 它 可 让 
接收 方 知道 发 送 方 是 否 正 在 重 传 前 一 个 发 送 分 组 (接收 到 的 分 组 序号 与 最 近 收 到 的 分 组 序 
号 相同 ) ,或 是 一 个 新 分 组 (序号 变化 了 ， 用 模 2 运算 “前 向 ”移动 ) 。 因 为 目前 我 们 假 
定 信道 不 丢 分 组 ，ACK 和 NAK 分 组 本 身 不 需要 指明 它们 要 确认 的 分 组 序号 。 发 送 方 知道 
所 接收 到 的 ACK 和 NAK 分 组 (无 论 是 否 是 含糊 不 清 的 ) 是 为 响应 其 最 近 发 送 的 数据 分 组 
而 生成 的 。 

图 3-11 和 图 3-12 给 出 了 对 rdt2. 1 的 FSM 描述 ， 这 是 rdt2.0 的 修订 版 。rdt2. 1 的 发 送 
方 和 接收 方 FSM 的 状态 数 都 是 以 前 的 两 倍 。 这 是 因为 协议 状态 此 时 必须 反映 出 目前 (由 
发 送 方 ) 正 发 送 的 分 组 或 (在 接收 方 ) 希望 接收 的 分 组 的 序号 是 0 还 是 1。 值 得 注意 的 
是 ,发送 或 期 望 接收 0 号 分 组 的 状态 中 的 动作 与 发 送 或 期 望 接收 1 号 分 组 的 状态 中 的 动作 
是 相似 的 ; 唯一 的 不 同 是 序号 处 理 的 方法 不 同 。 

协议 rdt2. 1 使 用 了 从 接收 方 到 发 送 方 的 肯定 确认 和 否定 确认 。 当 接收 到 失 序 的 分 组 
时 ， 接 收 方 对 所 接收 的 分 组 发 送 一 个 肯定 确认 。 如 果 收 到 受 损 的 分 组 ， 则 接收 方 将 发 送 一 
个 否定 确认 。 如 果 不 发 送 NAK， 而 是 对 上 次 正确 接收 的 分 组 发 送 一 个 ACK， 我 们 也 能 实 
ME NAK 一 样 的 效果 。 发 送 方 接收 到 对 同一 个 分 组 的 两 个 ACK 〈 即 接收 元 余 ACK 
(duplicate ACK)) 后 ， 就 知道 接收 方 没有 正确 接收 到 跟 在 被 确认 两 次 的 分 组 后 面 的 分 组 。 
rdt2. 2 是 在 有 比特 差错 信道 上 实现 的 一 个 无 NAK 的 可 靠 数 据 传输 协议 ， 如 图 3- 13 和 
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图 3-14 所 示 。zrd2. 1 All rdt2. 2 之 间 的 细微 变化 在 于 ， 接 收 方 此 时 必须 包括 由 一 个 ACK 报 
文 所 确认 的 分 组 序号 (这 可 以 通过 在 接收 方 FSM 中 ,在 make_pkt() 中 包括 参数 ACK 0 或 
ACK 1 来 实现 ) ， 发 送 方 此 时 必须 检查 接收 到 的 ACK 报 文中 被 确认 的 分 组 序号 (这 可 通过 
在 发 送 方 FSM F, 在 isACK() 中 包括 参数 0 或 1 来 实现 ) 。 
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isNAK (revpkt) ) 


a 
Wo ; 


udt_send (sndpkt) 





rdt_rcvlrcvpkt) rdt_rev (recvpkt) 
&& notcorrupt (revpkt) j && notcorrupt (rcvpkt) 
&& isACK(revpkt) && isACK (rcvpkt) 

A A 


rdt_rev (revpkt) && 
(corrupt (revpkt) | | 


isNAK (rcvpkt) ) ae 


udt_send (sndpkt) rdt_send (data) 





sndpkt=make_pkt (1,data, checksum) 
udt_send(sndpkt) 


图 3-11 rd2. 1 发送 方 


rdt_rcv (rcvpkt) && notcorrupt (rcvpkt) 
&& has_seq0 (rcvpkt) 


extract (rcvpkt, data) 
deliver_data (data) 
sndpkt=make_pkt (ACK, checksum) 
dt. d dpk 
rdt_rev (revpkt) udt_sendsndpkt) 


= a rdt_rev(revpkt) && corrupt (rcvpkt) 
&& corrupt (revpkt) Se ee SHOpk tmake BKE (NAR; checksum) 
sndpkt=make_pkt (NAK, checksum) ~ udt_send (sndpkt) 
udt_send (sndpkt) “a 
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rdt_rev(revpkt) && notcorrupt 
(rcvpkt) &&has_seql (rcvpkt) rdt_rev(revpkt) && notcorrupt 


= A Dy emare revpkt) &&has_seq0 (rcvpkt) 
sndpkt=make_pkt (ACK, checksum) sndpkt=make_pkt (ACK, checksum) 
udt_send (sndpkt) udt_send (sndpkt) 


rdt_rcv (revpkt) && notcorrupt (revpkt) 
&& has_seql (rcvpkt) 


extract (rcvpkt, data) 
deliver_data (data) 
sndpkt=make_pkt (ACK, checksum) 
udt_send (sndpkt) 


图 3-12 rdt2. 1 接收 方 
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rdt_send (data) 


sndpkt=make_pkt (0, data, checksum) 
udt_send (sndpkt) 


rdt_rev(rcevpkt) && 
(corrupt (revpkt) | | 
isACK (rcvpkt,1)) 


udt_send(sndpkt) 





rdt_rev(revpkt) rdt_rev (revpkt) 
&& notcorrupt (revpkt) && notcorrupt (rcvpkt) 
&& isACK (revpkt,1) && isACK(rcvpkt, 0) 


A A 


rdt_rev(revpkt) && 
(corrupt (revpkt) | | 
isACK (revpkt, 0) ) 





udt_send (sndpkt) rdt_send (data) 


sndpkt=make_pkt (1, data, checksum) 
udt_send (sndpkt) 


图 3-13 rdt2.2 发 送 方 


rdt_rev(revpkt) && notcorrupt (rcvpkt) 
&& has_seq0 (rcvpkt) 


extract (rcvpkt, data) 

deliver_data (data) rdt_rev(revpkt) && 
sndpkt=make_pkt (ACK, 0, checksum) (corrupt (revpkt) | | 
udt_send (sndpkt) has_seq0 (rcvpkt) ) 








sndpkt=make_pkt (ACK, 0, checksum) 
udt_send (sndpkt) 


rdt_rcv(revpkt) && 
(corrupt (rcvpkt) | | 
has_seql (rcvpkt) ) 


sndpkt=make_pkt (ACK, 1, checksum) 
udt_send(sndpkt) 


rdt_rev (rcevpkt) && notcorrupt (revpkt) 
&& has_seql (rcvpkt) 


extract (revpkt, data) 
deliver_data (data) 
sndpkt=make_pkt (ACK, 1, checksum) 
udt_send (sndpkt) 


3-14 rdt2. 2 接收 方 


3. 经 具有 比特 差错 的 丢 包 信道 的 可 靠 数据 传输 : rdt3. 0 

现在 假定 除了 比特 受 损 外 ， 底 层 信道 还 会 丢 包 ， 这 在 今天 的 计算 机 网 络 〈 包 括 因 特 
网 ) 中 并 不 罕见 。 协 议 现 在 必须 处 理 另 外 两 个 关注 的 问题 : 怎样 检测 丢 包 以 及 发 生 丢 包 后 
该 做 些 什么 。 在 rdt2. 2 中 已 经 研发 的 技术 ， 如 使 用 检验 和 、 序 号 、ACK 分 组 和 重 传 等 ， 使 
我 们 能 给 出 后 一 个 问题 的 答案 。 为 解决 第 一 个 关注 的 问题 ， 还 需 增 加 一 种 新 的 协议 机 制 。 

有 很 多 可 能 的 方法 用 于 解决 丢 包 问题 (在 本 章 结尾 的 习题 中 研究 了 几 种 其 他 方法 ) 。 
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这 里 ， 我 们 让 发 送 方 负责 检测 和 恢复 丢 包 工作 。 假 定 发 送 方 传输 一 个 数据 分 组 ， 该 分 组 或 
者 接收 方 对 该 分 组 的 ACK 发 生 了 丢失 。 在 这 两 种 情况 下 ， 发 送 方 都 收 不 到 应 当 到 来 的 接 
收 方 的 响应 。 如 果 发 送 方 愿意 等 待 足够 长 的 时 间 以 便 确 定 分 组 已 丢失 ， 则 它 只 需 重 传 该 数 
据 分 组 即 可 。 你 应 该 相信 该 协议 确实 有 效 。 

但 是 发 送 方 需要 等 待 多 入 才 能 确定 已 丢失 了 某 些 东西 呢 ? 很 明显 发 送 方 至 少 需要 等 待 
这 样 长 的 时 间 : 即 发 送 方 与 接收 方 之 间 的 一 个 往返 时 延 (可 能 会 包括 在 中 间 路 由 器 的 缓冲 
AYRE) 加 上 接收 方 处 理 一 个 分 组 所 需 的 时 间 。 在 很 多 网 络 中 ， 最 坏 情 况 下 的 最 大 时 延 是 很 
难 估算 的 ， 确 定 的 因素 非常 少 。 此 外 ， 理 想 的 协议 应 尽 可 能 快 地 从 丢 包 中 恢复 出 来 ， 等 待 
一 个 最 坏 情 况 的 时 延 可 能 意味 着 要 等 待 一 段 较 长 的 时 间 ， 直 到 启动 差错 恢复 为 止 。 因 此 实 
践 中 采取 的 方法 是 发 送 方 明智 地 选择 一 个 时 间 值 ， 以 判定 可 能 发 生 了 丢 包 (尽管 不 能 确 
保 ) 。 如 果 在 这 个 时 间 内 没有 收 到 ACK， 则 重 传 该 分 组 。 注 意 到 如 果 一 个 分 组 经 历 了 一 
特别 大 的 时 延 ， 发 送 方 可 能 会 重 传 该 分 组 ， 即 使 该 数据 分 组 及 其 ACK 都 没有 丢失 。 这 就 
在 发 送 方 到 接收 方 的 信道 中 引入 了 宛 余 数据 分 组 (duplicate data packet) 的 可 能 性 。 幸 运 
的 是 ，rdt2.2 协议 已 经 有 足够 的 功能 ( 即 序号 ) 来 处 理 元 余 分 组 情况 。 

从 发 送 方 的 观点 来 看 ， 重 传 是 一 种 万 能 灵 药 。 发 送 方 不 知道 是 一 个 数据 分 组 丢失 ， 还 
是 一 个 ACK 丢失 ， 或 者 只 是 该 分 组 或 ACK 过 度 延 时 。 在 所 有 这 些 情况 下 ， 动 作 是 同样 
的 ; 重 传 。 为 了 实现 基于 时 间 的 重 传 机 制 ， 需 要 一 个 倒 计 数 定时 器 (countdown timer) ,在 
一 个 给 定 的 时 间 量 过 期 后 ， 可 中 断 发 送 方 。 因 此 ， 发 送 方 需要 能 做 到 : 全 每 次 发 送 一 个 分 
组 〈 包 括 第 一 次 分 组 和 重 传 分 组 ) 时 ， 便 启动 一 个 定时 器 。 四 响应 定时 器 中 断 (采取 适 
当 的 动作 ) OAIE iF o 

图 3-15 给 出 了 rdt3. 0 的 发 送 方 FSM， 这 是 一 个 在 可 能 出 错 和 丢 包 的 信道 上 可 靠 传 


rdt_send (data) 

sndpkt=make_pkt (0,data, checksum) rdt_rev(revpkt) && 
udt_send(sndpkt) (coreupt(révpict) | | 
start_timer p p 


Sy isACK —— 1)) 
"Sa 
rdt_rev (revpkt) 
A timeout 
verre ay 
al o Pe udt_send (sndpkt) 


start timer 





rdt_rev (rcvpkt) ki 
&& notcorrupt (revpkt) 
&& isACK (rcvpkt, 1) rdt_rcV (ICVPKt) 
TAR && notcorrupt (revpkt) 
t t 
a aina && isACK (rcvpkt, 0) 
à stop_timer 
timeout -Wd = 
udt_send (sndpkt) AG n2 yat i 
start_timer AE TA 4 WW 
bn ee D 
rdt_rev (revpkt) && Sa 
(corrupt (revpkt) | | 
isACK (rcvpkt,0)) rdt_send (data) 
A sndpkt=make_pkt (1,data, checksum) 


udt_send (sndpkt) 
start_timer 


图 3-15 rdt3. 0 发 送 方 
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输 数 据 的 协议 ; 在 课 后 习题 中 ， 将 请 你 提供 rdt3. 0 的 接收 方 FSM。 图 3-16 显示 了 在 没 
有 丢 包 和 延迟 分 组 情况 下 协议 运作 的 情况 ， 以 及 它 是 如 何 处 理 数 据 分 组 丢失 的 。 在 
图 3-16 中 ， 时 间 从 图 的 顶部 朝 底 部 移动 ; 注意 到 一 个 分 组 的 接收 时 间 必 定 迟 于 一 个 分 
组 的 发 送 时 间 ， 这 是 因为 发 送 时 延 与 传播 时 延 之 故 。 在 图 3-16b ~d 中 ， 发 送 方 括号 部 
分 表明 了 定时 器 的 设置 时 刻 以 及 随后 的 超时 。 本 章 后 面 的 习题 探讨 了 该 协议 几 个 更 细微 
的 方面 。 因 为 分 组 序号 在 0 和 1 之 间 交 震 ， 因 此 rdi3.0 有 时 被 称 为 比特 交替 协议 (alter- 


nating- bit protocol) 。 


发 送 方 接收 方 发 送 方 接收 方 


发 送 分 组 发 送 分 组 0 $ ~ko 1 
0: wen kio > + i 


Ti 接收 分 组 0 
: a 发 送 ACK 0 接收 ACK0 : 发 送 ACK 0 
接收 ACK 0 ; Der, ARMI wot 
组 1 ; : 
发 送 分 et 接收 分 组 1 超时 isi 
Fhe eens 重 发 分 组 1 i 
接收 ACK 1: ; ki] > 
ses | NE et “w 接收 分 组 1 


in 和 - P 发 送 ACK 1 
接收 ACK 1 : ae en 


kt 
eat 接收 分 组 0 
; : ; :2 发 送 ACK 0 
a) 无 丢 包 操作 b) 分 组 丢失 
发 送 方 接收 方 发 送 方 接收 方 
发 送 分 组 0: Lto 发 送 分 组 0 | pkt ; 
:0 i 
N Che > 发 送 ACK 0 接收 ACK0 ° ES: 接收 分 组 0 
a 发 送 分 组 1 pee: RIBACKO 


à :~ Pkt : 
qi 接收 分 组 1 mls ee 接收 分 组 1 


接收 ACK 0 Pkt} 
ie a 重 发 分 组 1 |; Pkey ;发 送 ACK 1 


: 接收 分 组 1 


mea Pky DA he 
: : ACK i: yi 〈 检 测 宛 余 ) 
ees 接收 分 组 1 DEMO: pkto pS ;发 送 ACK 1 
: pC: (检测 元 余 ) 
: 发 送 ACK 1 ;接收 分 组 0 
anaes Pkto : 发 送 ACK 1 : oF 4 发 送 ACK 0 
A : 4 è è 
po 接收 分 组 0 igs ic 
f No 发 送 ACK 0 ; 


N 
> 
< 


c) 丢失 ACK d) 过 早 超时 
图 3-16 rdt3. 0 的 运行 ， 比 特 交替 协议 


现在 我 们 归纳 一 下 数据 传输 协议 的 要 点 。 在 检验 和 、 序 号 、 定 时 器 、 表 定 和 否定 确认 
分 组 这 些 技术 中 ， 每 种 机 制 都 在 协议 的 运行 中 起 到 了 必 不 可 少 的 作用 。 至 此 ， 我 们 得 到 了 
一 个 可 靠 数 据 传 输 协 议 ! 





3. 4.2 流水 线 可 靠 数据 传输 协议 


rdt3.0 是 一 个 功能 正确 的 协议 ， 但 并 非 人 人 都 对 它 的 性 能 满意 ， 特 别 是 在 今天 的 高 速 
网 络 中 更 是 如 此 。rdB. 0 性 能 问题 的 核心 在 于 它 是 一 个 停 等 协议 。 

为 了 评价 该 停 等 行为 对 性 能 的 影响 ， 可 考虑 一 种 具有 两 台 主 机 的 理想 化 场合 ， 一 台 主 
机 位 于 美国 西海 岸 ， 另 一 台 位 于 美国 东海 岸 ， 如 图 3-17 所 示 。 在 这 两 个 端 系统 之 间 的 光 
速 往返 传播 时 延 RTT KAW 30 毫秒。 假定 彼此 通过 一 条 发 送 速率 尺 为 1Gbps (每 秒 10" 比 
特 ) 的 信道 相连 。 包 括 首部 字段 和 数据 的 分 组 长 工 为 1000 字 节 (8000 比特 ) ， 发 送 一 个 
分 组 进入 1Cbps 链 路 实际 所 需 时 间 是 : 
_ L _ 8000bit/pkt 

R 10° bit/s 


= 8ys/pkt 





a) 一 个 运行 中 的 停 等 协议 b) 一 个 运行 中 的 流水 线 协议 
图 3-17 停 等 协议 与 流水 线 协议 


图 3-18a 显示 了 对 于 该 停 等 协议 ， 如 果 发 送 方 在 上 =0 时 刻 开 始 发 送 分 组 ， 则 在 t = 
L/R=8ys 后 ， 最 后 1 比特 数据 进入 了 发 送 端 信道 。 该 分 组 经 过 15ms 的 穿越 国家 的 旅途 后 
到 达 接 收 端 ， 该 分 组 的 最 后 1 比特 在 时 刻 上 = RTT/2 + L/R =15. 008ms 时 到 达 接 收 方 。 为 了 
简化 起 见 ， 假 设 ACK 分 组 很 小 (以 便 我 们 可 以 忽略 其 发 送 时 间 ) ， 接 收 方 一 旦 收 到 一 个 数 
据 分 组 的 最 后 1 比特 后 立即 发 送 ACK，ACK 在 时 刻 1= RIT + L/R =30. 008ms 时 在 发 送 方 
出 现 。 此 时 ， 发 送 方 可 以 发 送 下 一 个 报 文 。 因 此 ， 在 30. 008ms 内 ， 发 送 方 的 发 送 只 用 了 
0. 008ms。 如 果 我 们 定义 发 送 方 〈 或 信道 ) 的 利用 率 (utilization) H: 发 送 方 实际 忙于 将 
发 送 比 特 送 进 信道 的 那 部 分 时 间 与 发 送 时 间 之 比 ， 图 3-18a 中 的 分 析 表 明了 停 等 协议 有 着 
非常 低 的 发 送 方 利用 率 Uende: 


Ua = = = 0. 000 27 


这 就 是 说 ， 发 送 方 只 有 万 分 之 2.7 时 间 是 忙 的 。 从 其 他 角度 来 看 ， 发 送 方 在 30. 008ms 
内 只 能 发 送 1000 字 节 ， 有 效 的 吞吐 量 仅 为 267kbps， 即 使 有 1Gbps 的 链 路 可 用 也 是 如 此 ! 
想象 一 个 不 幸 的 网 络 经 理 购买 了 一 条 千 兆 比 容量 的 链 路 ， 但 他 仅 能 得 到 267kbps 吞吐 量 的 
情况 ! 这 是 一 个 形象 的 网 络 协议 限制 底层 网 络 硬件 所 提供 的 能 力 的 图 例 。 而 且 ， 我 们 还 忽 
略 了 在 发 送 方 和 接收 方 的 底层 协议 处 理 时 间 ， 以 及 可 能 出 现在 发 送 方 与 接收 方 之 间 的 任何 
中 间 路 由 器 上 的 处 理 与 排队 时 延 。 考 虑 到 这 些 因 素 ， 将 进一步 增加 时 延 ， 使 其 性 能 更 
糟糕 。 

这 种 特殊 的 性 能 问题 的 一 个 简单 解决 方法 是 : 不 以 停 等 方式 运行 ， 允 许 发 送 方 发 送 多 
个 分 组 而 无 须 等 竺 确认， 如 在 图 3-17b 图 示 的 那样 。 图 3-18b 显示 了 如 果 发 送 方 可 以 在 等 
待 确认 之 前 发 送 3 个 报 文 ， 其 利用 率 也 基本 上 提高 3 倍 。 因 为 许多 从 发 送 方向 接收 方 输送 
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的 分 组 可 以 被 看 成 是 填充 到 一 条 流水 线 中 ， 故 这 种 技术 被 称 为 流水 线 (pipelining)。 流 水 
线 技术 对 可 靠 数据 传输 协议 可 带 来 如 下 影响 : 


发 送 方 接收 方 
首 个 分 组 的 第 1 个 A A 
比特 被 传输 ,f=0 — iw- : 
首 个 分 组 的 最 后 1 个 比特 
被 传输 ，f=L/R 


:_ 首 个 分 组 的 第 1 个 比特 到 达 
:一 首 个 分 组 的 最 后 1 个 比特 到 达 ; 发 送 ACK 


ACK 到 达 ， 发 送 下 一 个 分 组 ， 
t=RTT + L/R 





首 个 分 组 的 第 1 个 
比特 被 发 送 ，=0 
首 个 分 组 的 最 后 1 个 比特 
被 发 送 ，t=L/R 










:一 首 个 分 组 的 第 1 个 比特 到 达 

:一 首 个 分 组 的 最 后 1 个 比特 到 达 ， 发 送 ACK 
:一 第 2 个 分 组 的 最 后 1 个 比特 到 达 ， 发 送 ACK 
: :一 第 3 个 分 组 的 最 后 1 个 比特 到 达 ， 发 送 ACK 
ACK 到 达 ， 发 送 下 一 个 分 组 ， : ee e 

t=RTT +L/R s - 


b) 流水 线 操 作 
图 3-18 停 等 和 流水 线 发 送 


。 必须 增加 序号 范围 ， 因 为 每 个 输送 中 的 分 组 (不 计算 重 传 的 ) 必须 有 一 个 唯一 的 
序号 ， 而 且 也 许 有 多 个 在 输送 中 的 未 确认 报 文 。 

© 协议 的 发 送 方 和 接收 方 两 端 也 许 不 得 不 缓存 多 个 分 组 。 发 送 方 最 低 限 度 应 当 能 组 
冲 那些 已 发 送 但 没有 确认 的 分 组 。 如 下 面 讨论 的 那样 ， 接 收 方 或 许 也 需要 缓存 那 
些 已 正确 接收 的 分 组 。 

。 所 需 序号 范围 和 对 缓冲 的 要 求 取决 于 数据 传输 协议 如 何 处 理 丢失 、 损 坏 及 延 时 过 
大 的 分 组 。 解 决 流水 线 的 差错 恢复 有 两 种 基本 方法 是 : 回 退 N 2 (Go-Back-N, 
GBN) 和 选择 重 传 (Selective Repeat, SR) 。 





3.4.3 回 退 信步 


在 回 退 N 步 (GBN) 协议 中 ， 人 允许 发 送 方 发 送 多 个 分 组 〈 当 有 多 个 分 组 可 用 时 ) 而 
不 需 等 待 确认 ,但 它 也 受 限 于 在 流水 线 中 未 确认 的 分 组 数 不 能 超过 某 个 最 大 允许 数 N。 在 
本 节 中 我 们 较为 详细 地 描述 GBN。 但 在 继续 阅读 之 前 ， 建 议 你 操作 本 书 配 套 Web 网 站 上 
的 CBN Java 小 程序 (这 是 一 个 非常 好 的 Java 程序 ) 。 

图 3-19 显示 了 发 送 方 看 到 的 CBN 协议 的 序号 范围 。 如 果 我 们 将 基 序 号 (base) 定义 
为 最 早 未 确认 分 组 的 序号 ,将 下 一 个 序号 (nextseqnum) 定义 为 最 小 的 未 使 用 序号 〈 即 下 
一 个 待 发 分 组 的 序号 ) ， 则 可 将 序号 范围 分 割 成 4 段 。 在 [0，base -1] 段 内 的 序号 对 应 
于 已 经 发 送 并 被 确认 的 分 组 。[ base，nextseqnum - 1] 段 内 对 应 已 经 发 送 但 未 被 确认 的 分 
组 。[ nextseqnum，base +N -1] 段 内 的 序号 能 用 于 那些 要 被 立即 发 送 的 分 组 ， 如果 有 数 
据 来 自 上 层 的 话 。 最 后 ， 大 于 或 等 于 base +N 的 序号 是 不 能 使 用 的 ， 直 到 当前 流水 线 中 未 
被 确认 的 分 组 (特别 是 序号 为 base 的 分 组 ) 已 得 到 确认 为 止 。 

基 序号 下 一 个 序号 


(base) (nextseqnum) 


图 例 : 
图 例 : 


am Fe 


| 发送， 还 未 
窗口 长 度 les [ram 
N 


图 3-19 在 CBN 中 发 送 方 看 到 的 序号 


如 图 3-19 所 提示 的 那样 ， 那些 已 被 发 送 但 还 未 被 确认 的 分 组 的 许可 序号 范围 可 以 被 
看 成 是 一 个 在 序号 范围 内 长 度 为 N 的 窗口 。 随 着 协议 的 运行 ， 该 窗口 在 序号 空间 向 前 滑 
动 。 因 此 ，N 常 被 称 为 窗口 长 度 (window size), CBN 协议 也 常 被 称 为 滑动 窗口 协议 
(sliding-window protocol) 。 你 也 许 想 知道 ， 我 们 为 什么 先 要 限制 这 些 被 发 送 的 、 未 被 确认 
的 分 组 的 数目 为 N WE? 为 什么 不 允许 这 些 分 组 为 无 限制 的 数目 呢 ? 我 们 将 在 3. 5 节 看 到 ， 
流量 控制 是 对 发 送 方 施加 限制 的 原因 之 一 。 我 们 将 在 3. 7 节 学 习 TCP 拥塞 控制 时 分 析 另 一 
个 原因 。 

在 实践 中 ， 一 个 分 组 的 序号 承载 在 分 组 首部 的 一 个 固定 长 度 的 字段 中 。 如 果 分 组 序号 
字段 的 比特 数 是 上 ， 则 该 序号 范围 是 [0，2* -1] 。 在 一 个 有 限 的 序号 范围 内 ， 所 有 涉及 序 
号 的 运算 必须 使 用 模 2 运算 。 ( 即 序号 空间 可 被 看 作 是 一 个 长 度 为 2 的 环 ， 其 中 序号 
2 -1 紧 接 着 序号 0。) 前 面 讲 过 ，rdt3.0 有 一 个 1 比特 的 序号 ， 序 号 范围 是 [0, 1]。 在 本 
章 末 的 几 道 习题 中 探讨 了 一 个 有 限 的 序号 范围 所 产生 的 结果 。 我 们 将 在 3.5 节 看 到 ，TCP 
有 一 个 32 比特 的 序号 字段 ， 其 中 的 TCP 序号 是 按 字 节 流 中 的 字 节 进行 计数 的 ， 而 不 是 按 
分 组 计数 。 

图 3-20 和 图 3-21 给 出 了 一 个 基于 ACK、 无 NAK 的 GBN 协议 的 发 送 方 和 接收 方 这 两 
端的 扩展 FSM 描述 。 我 们 称 该 PSM 描述 为 扩展 FSM， 是 因为 我 们 已 经 增加 了 变量 (类似 
于 编程 语言 中 的 变量 ) base 和 nextseqnum， 还 增加 了 对 这 些 变 量 的 操作 以 及 与 这 些 变 量 有 
关 的 条 件 动 作 。 注 意 到 该 扩展 的 FSM 规约 现在 变 得 有 点 像 编 程 语言 规约 。 [ Bochman 
1984] 对 FSM 扩展 技术 提供 了 一 个 很 好 的 综述 ， 也 提供 了 用 于 定义 协议 的 其 他 基于 编程 
语言 的 技术 。 
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rdt_send (data) 


if (nextseqnum<base+N) { 
sndpkt [nextseqnum]=make_pkt (nextseqnum, data, checksum) 
udt_send(sndpkt [nextseqnum] ) 
if (base==nextseqnum) 


~ start_timer 
~ 
$ Se nextseqnum++ 
————— ie 
~ 
base=1 Se } 
™ 
nextseqnum=1 Se else 


~ refuse Cc) 


tment  — 


start_timer 
等 待 udt_send (sndpkt [base] ) 
udt_send (sndpkt [base+1] 


rdt_rev(revpkt) && cortam (7 
eee adt _send(sndpkt [nextseqnum-1] ) 


A 


k= ee 


base=getacknum(revpkt) +1 
If (base==nextseqnum) 
stop_timer 
else 
start_timer 


图 3-20 GBN 发 送 方 的 扩展 FSM 描述 


rdt_rcev (rcvpkt) 
&& notcorrupt (rcvpkt) 
&& hasseqnum(rcvpkt, expectedseqnum) 


extract (rcvpkt, data) 

deliver_data (data) 

sndpkt=make_pkt (expectedseqnum, ACK, checksum) 
udt_send (sndpkt) 

expectedseqnum++ 


default 





udt_send (sndpkt) 


expectedseqnum=1 
sndpkt=make_pkt (0, ACK, checksum) 


3-21 GBN 接收 方 的 扩展 FSM 描述 


GBN 发 送 方 必须 响应 三 种 类 型 的 事件 : 

e 上 层 的 调用 。 当 上 层 调用 rdt_send() 时 ， 发 送 方 首先 检查 发 送 窗口 是 否 已 满 ， 即 是 
BTA W 个 已 发 送 但 未 被 确认 的 分 组 。 如 果 窗 日 未 满 ， 则 产生 一 个 分 组 并 将 其 发 送 ， 
并 相应 地 更 新 变量 。 如 果 窗 口 已 满 ， 发 送 方 只 需 将 数据 返回 给 上 层 ， 隐 式 地 指示 
上 层 该 窗口 已 满 。 然 后 上 层 可 能 会 过 一 会 儿 再 试 。 在 实际 实现 中 ， 发 送 方 更 可 能 
缓存 (并 不 立刻 发 送 ) 这 些 数据 ， 或 者 使 用 同步 机 制 (如 一 个 信号 量 或 标志 ) È 
许 上 层 在 仅 当 窗口 不 满 时 才 调 用 rdt_send() 。 

e 收 到 一 个 ACK。 在 GBN 协议 中 ， 对 序号 为 n 的 分 组 的 确认 采取 累积 确认 (cumu- 
lative acknowledgment) 的 方式 ， 表 明 接 收 方 已 正确 接收 到 序号 为 n WABA n 
在 内 的 所 有 分 组 。 稍 后 讨论 CBN 接收 方 一 端 时 ， 我 们 将 再 次 研究 这 个 主题 。 
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。 超时 事件 。 协 议 的 名 字 “ 回 退 入 步 ”来 源 于 出 现 丢 失 和 时 延 过 长 分 组 时 发 送 方 的 
行为 。 就 像 在 停 等 协议 中 那样 ， 定 时 器 将 再 次 用 于 恢复 数据 或 确认 分 组 的 丢失 。 
如 果 出 现 超时 ， 发 送 方 重 传 所 有 已 发 送 但 还 未 被 确认 过 的 分 组 。 图 3-20 中 的 发 送 
方 仅 使 用 一 个 定时 器 ， 它 可 被 当 作 是 最 早 的 已 发 送 但 未 被 确认 的 分 组 所 使 用 的 定 
时 器 。 如 果 收 到 一 个 ACK， 但 仍 有 已 发 送 但 未 被 确认 的 分 组 ， 则 定时 器 被 重新 启 
动 。 如 果 没 有 已 发 送 但 未 被 确认 的 分 组 ， 停 止 该 定时 器 。 

在 CBN 中 ,接收 方 的 动作 也 很 简单 。 如 果 一 个 序号 为 n 的 分 组 被 正确 接收 到 ， 并 且 
按 序 ( 即 上 次 交付 给 上 层 的 数据 是 序号 为 n -1 的 分 组 )， 则 接收 方 为 分 组 n 发 送 一 个 
ACK， 并 将 该 分 组 中 的 数据 部 分 交付 到 上 层 。 在 所 有 其 他 情况 下 ， 接 收 方 丢弃 该 分 组 ， 并 
为 最 近 按 序 接收 的 分 组 重新 发 送 ACK。 注 意 到 因为 一 次 交付 给 上 层 一 个 分 组 ， 如 果 分 组 天 
已 接收 并 交付 ， 则 所 有 序号 比 开 小 的 分 组 也 已 经 交付 。 因 此 ， 使 用 累积 确认 是 CBN 一 个 
自然 的 选择 。 

在 CBN 协议 中 ， 接 收 方 丢 弃 所 有 失 序 分 组 。 尽 管 丢弃 一 个 正确 接收 〈 但 失 序 ) 的 分 
组 有 点 愚 剧 和 浪费 ， 但 这 样 做 是 有 理由 的 。 前 面 讲 过 ， 接 收 方 必 须 按 序 将 数据 交付 给 上 
层 。 假 定 现在 期 望 接 收 分 组 n， 而 分 组 n+1 却 到 了 。 因 为 数据 必须 按 序 交付 ， 接 收 方 可 能 
缓存 (保存 ) 分 组 n+1， 然后， 在 它 收 到 并 交付 分 组 后 ， 青 将 该 分 组 交付 到 上 层 。 然 
M, WRIA n 丢失 ， 则 该 分 组 及 分 组 n+1 最 终 将 在 发 送 方 根据 CBN 重 传 规则 而 被 重 
传 。 因 此 ， 接 收 方 只 需 丢 弃 分 组 n+1 即 可 。 这 种 方法 的 优点 是 接收 缓存 简单 ， 即 接收 方 







不 需要 缓存 任何 失 序 分 组 。 因 此 ， 虽 然 。 。 BBA 接收 广 

发 送 方 必须 维护 窗口 的 上 下 边界 及 发 送 分 组 0 ; 

nextseqnum 在 该 窗口 中 的 位 置 ， 但 是 接 pd 

收 方 需要 维护 的 唯一 信息 就 是 下 一 个 按 pepa: poy 

序 接收 的 分 组 的 序号 。 该 值 保 存在 ex- : : 

pectedseqnum 变量 中 ， 如 图 3-21 中 接收 发 送 分 组 2 : : hoa 

Ti FSM 所 示 。 当 然 ， 丢弃 一 个 正确 接收 : i 

的 分 组 的 缺点 是 随后 对 该 分 组 的 重 传 也 | og: 

许 会 丢失 或 出 错 ， 因 此 甚至 需要 更 多 的 (等 待 ) ; 

重 传 。 : : 接收 分 组 3， 丢 弃 
图 3-22 给 出 了 窗口 长 度 为 4 个 分 组 J | BRK! 

的 GBN 协议 的 运行 情况 。 因 为 该 窗口 | 接收 ACK0: : 

长 度 的 限制 ; 发 送 方 发 送 分 组 0 ~3， 然 | ama: : 

后 在 继续 发 送 之 前 ， 必须 等 待 直 到 一 个 发 送 分 组 5 : ppp 丢弃 

或 多 个 分 组 被 确认 。 当 接收 到 每 一 个 连 : : 发 送 ACK 1 

续 的 ACK (例如 ACK0 和 ACK1) 时 ， oa I sides ae 

该 窗口 便 向 前 滑动 ， 发 送 方便 可 以 发 送 。 ”发 送 分 组 3 Sy URAC I 

新 的 分 组 (分 别 是 分 组 4 和 分 组 5) 。 在 发送 分 组 4 : : 

接收 方 ， 分 组 2 委 失 ， 因 此 分 组 3 、4 PMs SS re 

和 5 被 发 现 是 失 序 分 组 并 被 丢弃 。 SS ;接收 分 组 3， 交 付 
在 结束 对 GBN 的 讨论 之 前 ， 需 要 ; 发 送 ACK 3 


提请 注意 的 是 ， 在 协议 栈 中 实现 该 协议 
可 能 与 图 3-20 中 的 扩展 FSM 有 相似 的 


v 


4: 


图 3-22 运行 中 的 GBN 
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结构 。 该 实现 也 可 能 是 以 各 种 过 程 形式 出 现 ， 每 个 过 程 实现 了 在 响应 各 种 可 能 出 现 的 事件 
时 要 采取 的 动作 。 在 这 种 基于 事件 的 编程 ( event- based programming) 方式 中 ， 这 些 过 程 
要 么 被 协议 栈 中 的 其 他 过 程 调用 ， 要么 作为 一 次 中 断 的 结果 。 在 发 送 方 ， 这 些 事件 包括 : 
人 中 来 自 上 层 实 体 的 调用 去 调用 rdt_send(); @@ 定 时 器 中 断 ; @ 报 文 到 达 时 ， KA FRA 
用 去 调用 rdt_rev() 。 本 章 后 面 的 编程 作业 会 使 你 有 机 会 在 一 个 模拟 网 络 环境 中 实际 实现 这 
些 例 程 ， 但 该 环境 却 是 真实 的 。 

这 里 我 们 注意 到 ，GBN 协议 中 综合 了 我 们 将 在 3.5 节 中 学 习 TCP 可 靠 数 据 传 输 构 件 
时 遇 到 的 所 有 技术 。 这 些 技术 包括 使 用 序号 、 累 积 确 认 、 检 验 和 以 及 超时 / 重 传 操作 。 


3.4.4 选择 重 传 


在 图 3-17 中 ，GBN 协议 潜在 地 允许 发 送 方 用 多 个 分 组 “填充 流水 线 ” ， 因 此 避免 了 停 
等 协议 中 所 提 到 的 信道 利用 率 问 题 。 然 而 ，GBN 本 身 也 有 一 些 情 况 存 在 着 性 能 问题 。 尤 其 
是 当 窗口 长 度 和 带宽 时 延 积 都 很 大 时 ， 在 流水 线 中 会 有 很 多 分 组 更 是 如 此 。 单 个 分 组 的 差 
错 就 能 够 引起 (GBN 重 传 大 量 分 组 ， 许 多 分 组 根本 没有 必要 重 传 。 随 着 信道 差错 率 的 增加 ， 
流水 线 可 能 会 被 这 些 不 必要 重 传 的 分 组 所 充斥 。 想 象 一 下 ， 在 我 们 口述 消息 的 例子 中 ， 如 
果 每 次 有 一 个 单词 含糊 不 清 ， 其 前 后 1000 个 单词 例如， 窗口 长 度 为 1000 个 单词 ) 不 得 
不 被 重 传 的 情况 。 此 次 口述 会 由 于 这 些 反 复述 说 的 单词 而 变 慢 。 

顾名思义 ， 选 择 重 传 (SR) 协议 通过 让 发 送 方 仅 重 传 那些 它 怀疑 在 接收 方 出 错 〈 即 
丢失 或 受 损 ) 的 分 组 而 避免 了 不 必要 的 重 传 。 这 种 个 别 的 、 按 需 的 重 传 要 求 接收 方 逐个 地 
确认 正确 接收 的 分 组 。 再 次 用 窗口 长 度 六 来 限制 流水 线 中 未 完成 、 未 被 确认 的 分 组 数 。 然 
而 ,与 CBN 不 同 的 是 ， 发 送 方 已 经 收 到 了 对 窗口 中 某 些 分 组 的 ACK。 图 3-23 显示 了 SR 
发 送 方 看 到 的 序号 空间 。 图 3-24 详细 描述 了 SR 发 送 方 所 采取 的 动作 。 


Send base nextseqnum 


图 例 : 


TI © es E = 
aC ae Lian’ [xm 


a) 发 送 方 看 到 的 序号 


rcv base 


i Te 


WOKEN aT aie 由 fm 有 
b) 接收 方 看 到 的 序号 
图 3-23 AEE (SR) 发 送 方 与 接收 方 的 序号 空间 
SR 接收 方 将 确认 一 个 正确 接收 的 分 组 而 不 管 其 是 否 按 序 。 失 序 的 分 组 将 被 缓存 直到 
所 有 丢失 分 组 ( 即 序 号 更 小 的 分 组 ) 皆 被 收 到 为 止 ， 这 时 才 可 以 将 一 批 分 组 按 序 交 付 给 上 


层 。 图 3-25 详细 列 出 了 SR 接收 方 所 采用 的 各 种 动作 。 图 3-26 给 出 了 一 个 例子 以 说 明 出 
REM SR 的 操作 。 值 得 注意 的 是 ， 在 图 3-26 中 接收 方 初始 时 缓存 了 分 组 3、4、5， 并 
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在 最 终 收 到 分 组 2 时 ， 才 将 它们 一 并 交付 给 上 层 。 


1. 从 上 层 收 到 数据 。 当 从 上 层 接收 到 数据 后 ，SR 发 送 方 检查 下 一 个 可 用 于 该 分 组 的 序号 。 如 果 序 号 位 于 发 送 方 
的 窗口 内 ， 则 将 数据 打包 并 发 送 ; 否则 就 像 在 CBN 中 一 样 ， 要 么 将 数据 缓存 ， 要 么 将 其 返回 给 上 层 以 便 以 后 传输 。 
2. 超时 。 定 时 器 再 次 被 用 来 防止 丢失 分 组 。 然 而 ， 现 在 每 个 分 组 必须 拥有 其 自己 的 逻辑 定时 器 ， 因 为 超时 发 


生 后 只 能 发 送 一 个 分 组 。 可 以 使 用 单个 硬件 定时 器 模拟 多 个 逻辑 定时 器 的 操作 [Varghese 1997] 

3. 收 到 ACK。 如 果 收 到 ACK， 倘 若 该 分 组 序号 在 窗口 内 ， 则 SR 发 送 方 将 那个 被 确认 的 分 组 标记 为 已 接收 。 
如 果 该 分 组 的 序号 等 于 send_base, - 则 窗口 基 序号 向 前 移动 到 具有 最 小 序号 的 未 确认 分 组 处 。 如 果 窗 口 移动 了 并 且 
有 序号 落 在 窗口 内 的 未 发 送 分 组 ， 则 发 送 这 些 分 组 。 





图 3-24 SR 发 送 方 的 事件 与 动作 


1. 序号 在 [rev_base，rev_base +N 一 1] 内 的 分 组 被 正确 接收 。 在 此 情况 下 ， 收 到 的 分 组 落 在 接收 方 的 窗口 
内 ,一 个 选择 ACK 被 回 送 给 发 送 方 。 如 果 该 分 组 以 前 没收 到 过 ， 则 缓存 该 分 组 。 如 果 该 分 组 的 序号 等 于 接收 窗口 
的 基 序 号 (图 3-23 中 的 rev_base) ， 则 该 分 组 以 及 以 前 缓存 的 序号 连续 的 (起 始 于 rev_base 的 ) 分 组 交付 给 上 层 。 
然后 ， 接 收 窗口 按 向 前 移动 分 组 的 编号 向 上 交付 这 些 分 组 。 举例 子 来 说 ， 考 虑 一 下 图 3-26。 当 收 到 一 个 序号 为 


rev_base =2 的 分 组 时 ， 该 分 组 及 分 组 3、4、5 可 被 交付 给 上 层 。 

2. 序号 在 【rev_base -NN，rev_base -1] 内 的 分 组 被 正确 收 到 。 在 此 情况 下 ， 必 须 产生 一 个 ACK， 即 使 该 分 组 
是 接收 方 以 前 已 确认 过 的 分 组 。 

3. 其 他 情况 。 忽 略 该 分 组 。 





图 3-25 SR 接收 方 的 事件 与 动作 


发 送 方 接收 方 
分 组 0 发 送 : : 
NE 45678 i 
分 组 1 发 送 : i 分 组 0 收 到 ， 交 付 ，ACK 0 发 送 
Ci 456789: > 0 GRR s 678 9 
; 分 组 1 收 到 ， 交 付 ，ACK 1 发 送 
分 组 2 发 送 Peer 


OWNS 456789: ,0 1 em 6 78 9 


(丢失 ) 
分 组 3 发 送 ， 窗 口 满 
OMNIS 456789; 


: > 分 组 3 收 到 ， 缓 存 ，ACK 3 发 送 
ACK 0 收 到 ， 分 组 4 发 送 。: : 0 1 BURMAN 6 7 8 9 
0 MR 567879: : 


ACK 1 收 到 ， 分 组 5 发 送 | ; 分 组 4 收 到 ， 缓 存 ，ACK 4 发 送 


0 1M 6 7 6 9: “0 1B c6 78 9 
: i 分 组 5 收 到 ， 缓 存 ，ACK 5 发 送 
分 组 2 超时 ， 重 传 分 组 2 : 2 0 1 RB 6 7 8 9 


0 E 78 9: 


; 分 组 2 收 到 ， 分 组 2、3、4、5 交 付 ， 
> ACK 2 发 送 


: °0123 4 5 ong 
ACK 3 收 到 ， 无 分 组 可 发 + : 
0 1 Bc 7 8 9: 


v A 


图 3-26 SR 操作 
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注意 到 图 3-25 中 的 第 二 步 很 重要 ， 接 收 方 重新 确认 〈 而 不 是 忽略 ) 已 收 到 过 的 那些 
序号 小 于 当前 窗口 基 序号 的 分 组 。 你 应 该 理解 这 种 重新 确认 确实 是 需要 的 。 例 如 ， 给 定 在 
图 3-23 中 所 示 的 发 送 方 和 接收 方 的 序号 空间 ， 如 果 分 组 send_base 的 ACK 没有 从 接收 方 传 
播 回 发 送 方 ， 则 发 送 方 最 终 将 重 传 分 组 send_base， 即 使 显然 (对 我 们 而 不 是 对 发 送 方 来 
说 !) 接收 方 已 经 收 到 了 该 分 组 。 如 果 接 收 方 不 确认 该 分 组 ， 则 发 送 方 窗口 将 永远 不 能 向 
前 滑动 ! 这 个 例子 说 明了 SR 协议 (和 很 多 其 他 协议 一 样 ) 的 一 个 重要 方面 。 对 于 哪些 分 
组 已 经 被 正确 接收 ， 哪 些 没有 ， 发 送 方 和 接收 方 并 不 总 是 能 看 到 相同 的 结果 。 对 SR 协议 
而 言 ， 这 就 意味 着 发 送 方 和 接收 方 的 窗口 并 不 总 是 一 致 。 

当 我 们 面 对 有 限 序 号 范围 的 现实 时 ， 发 送 方 和 接收 方 窗 口 间 缺乏 同步 会 产生 严重 的 后 
果 。 考 虑 下 面 例子 中 可 能 发 生 的 情况 ， 该 例 有 包括 4 个 分 组 序号 0、1、2、3 的 有 限 序号 
范围 且 窗 口 长 度 为 3。 假 定 发 送 了 分 组 0 至 2， 并 在 接收 方 被 正确 接收 且 确 认 了 。 此 时 ， 
接收 方 窗口 落 在 第 4、5、6 个 分 组 上 ， 其 序号 分 别 为 3、0、1。 现 在 考虑 两 种 情况 。 在 第 
一 种 情况 下 ， 如 图 3-27a 所 示 ， 对 前 3 个 分 组 的 ACK 丢失 ， 因 此 发 送 方 重 传 这 些 分 组 。 因 
此 ， 接 收 方 下 一 步 要 接收 序号 为 0 的 分 组 ， 即 第 一 个 发 送 分 组 的 副本 。 


发 送 方 窗口 接收 方 窗口 
(接收 后 ) (接收 后 ) 


DZ 3 0 1 > :分 组 0 









:ack 0 0 Wago 1 2 
:ACK 1 0 1 MW 1 2 
:ACK2 0 1 2 Bo 2 


超时 ， 重 传 
分 组 0 


is 
(NMA 3 0 1 2 :分 组 0 :接收 具有 序号 0 的 分 组 


a) 
发 送 方 窗口 接收 方 窗口 
(接收 后 ) (接收 后 ) 
W3012 : : 


acko o MINN o 1 2 


WH s012: 


: :ACK 1 0 120809 2 
mm 3012: : 


: PACK 2 0 1 2p 2 
oWMPB012 : 
0 1a 1 2 : 
: :接收 具有 序号 0 的 分 组 
$ ; 
b) 
图 3-27 SR 接收 方 窗口 太 大 的 困境 : 是 一 个 新 分 组 还 是 一 次 重 传 


a iw & 151 











在 第 二 种 情况 下 ， 如 图 3-27b 所 示 ， 对 前 3 个 分 组 的 ACK 都 被 正确 交付 。 因 此 发 送 方 
向 前 移动 窗口 并 发 送 第 4、5、6 个 分 组 ， 其 序号 分 别 为 3、0、1。 序 号 为 3 的 分 组 丢失 ， 
但 序号 为 0 的 分 组 到 达 〈 一 个 包含 新 数据 的 分 组 ) 。 

现在 考虑 一 下 图 3-27 中 接收 方 的 观点 ， 在 发 送 方 和 接收 方 之 间 有 一 个 假想 的 帘子 ， 
因为 接收 方 不 能 “看 见 ”发 送 方 采取 的 动作 。 接 收 方 所 能 观察 到 的 是 它 从 信道 中 收 到 的 以 
及 它 向 信道 中 发 出 报 文 序列 。 就 其 所 关注 的 而 言 ， 图 3-27 中 的 两 种 情况 是 等 同 的 。 没 有 
办 法 区 分 是 第 1 个 分 组 的 重 传 还 是 第 5 个 分 组 的 初次 传输 。 显 然 ， 窗 口 长 度 比 序号 空间 小 
1 时 协议 无 法 工作 。 但 窗口 必须 多 小 呢 ? 本 章 后 面 的 一 道 习 题 请 你 说 明 为 何 对 于 SR 协议 
而 言 ， 窗 口 长 度 必须 小 于 或 等 于 序号 空间 大 小 的 一 半 。 

在 本 书 配套 的 网 站 上 ， 可 以 找到 一 个 模仿 SR 协议 运行 的 Java 小 程序 。 尝 试 进行 你 以 
前 对 GBN Java 小 程序 所 进行 的 相同 的 实验 。 这 些 结果 与 你 期 望 的 一 致 吗 ? 

至 此 我 们 结束 了 对 可 靠 数 据 传输 协议 的 讨论 。 我 们 已 涵盖 许多 基础 知识 ， 并 介绍 了 多 
种 机 制 ， 这 些 机 制 可 一 起 提供 可 靠 数 据 传 输 。 表 3-1 总 结 这些 机 制 。 既 然 我 们 已 经 学 习 了 
所 有 这 些 运 行 中 的 机 制 ， 并 能 看 到 “全 景 ”， 我 们 建议 你 再 复习 一 遍 本 节 内 容 ， 看 看 这 些 
机 制 是 怎样 逐步 被 添加 进来 ， 以 涵盖 复杂 性 渐 增 的 (现实 的 ) 连接 发 送 方 与 接收 方 的 各 种 
信道 模型 的 ， 或 者 如 何 改 善 协议 性 能 的 。 


表 3-1 可 靠 数 据 传输 机 制 及 其 用 途 的 总 结 





机 制 用 途 和 说 明 
检验 和 用 于 检测 在 一 个 传输 分 组 中 的 比特 错误 
定时 器 用 于 超时 / 重 传 一 个 分 组 ， 可 能 因为 该 分 组 (或 其 ACK) 在 信道 中 丢失 了 。 由 于 当 一 个 分 组 延 


时 但 未 丢失 (过 早 超时 ) ,或 当 一 个 分 组 已 被 接收 方 收 到 但 从 接收 方 到 发 送 方 的 ACK 丢失 时 ， 可 
能 产生 超时 事件 ， 所 以 接收 方 可 能 会 收 到 一 个 分 组 的 多 个 宛 余 副本 


序号 用 于 为 从 发 送 方 流向 接收 方 的 数据 分 组 按 顺 序 编号 。 所 接收 分 组 的 序号 间 的 空隙 可 使 接收 方 检 
测 出 丢失 的 分 组 。 具 有 相同 序号 的 分 组 可 使 接收 方 检测 出 一 个 分 组 的 宛 余 副本 

-确认 接收 方 用 于 告诉 发 送 方 一 个 分 组 或 一 组 分 组 已 被 正确 地 接收 到 了 。 确 认 报 文通 常 携带 着 被 确认 
的 分 组 或 多 个 分 组 的 序号 。 确 认可 以 是 逐个 的 或 累积 的 ， 这 取决 于 协议 

否定 确认 接收 方 用 于 告诉 发 送 方 某 个 分 组 未 被 正确 地 接收 。 否 定 确认 报 文通 常 携带 着 未 被 正确 接收 的 分 
组 的 序号 


窗口 、 流 水 线 发 送 方 也 许 被 限制 仅 发 送 那些 序号 落 在 一 个 指定 范围 内 的 分 组 。 通 过 允许 一 次 发 送 多 个 分 组 但 
未 被 确认 ， 发 送 方 的 利用 率 可 在 停 等 操作 模式 的 基础 上 得 到 增加 。 我 们 很 快 将 会 看 到 ， 窗 口 长 度 
可 根据 接收 方 接收 和 缓存 报 文 的 能 力 、 网 络 中 的 拥塞 程度 或 两 者 情况 来 进行 设置 


我 们 通过 考虑 在 底层 信道 模型 中 的 一 个 遗留 假设 来 结束 对 可 靠 数 据 传输 协议 的 讨论 。 
前 面 讲 过 ,我们 曾 假定 分 组 在 发 送 方 与 接收 方 之 间 的 信道 中 不 能 被 重新 排序 。 这 在 发 送 方 
与 接收 方 由 单 段 物理 线路 相连 的 情况 下 ， 通 常 是 一 个 合理 的 假设 。 然 而 ， 当 连接 两 端的 
“信道 ”是 一 个 网 络 时 ， 分 组 重新 排序 是 可 能 会 发 生 的 。 分 组 重新 排序 的 一 个 表现 就 是 ， 
一 个 具有 序号 或 确认 号 x 的 分 组 的 旧 副 本 可 能 会 出 现 ， 即 使 发 送 方 或 接收 方 的 窗口 中 都 没 
有 包含 x。 对 于 分 组 重新 排序 ， 信 道 可 被 看 成 基本 上 是 在 缓存 分 组 ， 并 在 将 来 任意 时 刻 自 
然 地 释放 出 这 些 分 组 。 由 于 序号 可 以 被 重新 使 用 ， 那么 必须 小 心 ， 以 免 出 现 这 样 的 元 余 分 
组 。 实 际 应 用 中 采用 的 方法 是 ， 确 保 一 个 序号 不 被 重新 使 用 ， 直 到 发 送 方 “确信 ”任何 先 
前 发 送 的 序号 为 x 的 分 组 都 不 再 在 网 络 中 为 止 。 通 过 假定 一 个 分 组 在 网 络 中 的 “存活 ”时 
间 不 会 超过 某 个 固定 最 大 时 间 量 来 做 到 这 一 点 。 在 高 速 网 络 的 TCP 扩展 中 ， 最 长 的 分 组 寿 
命 被 假定 为 大 约 3 分 钟 [RFC 1323 ] [Sunshine 1978] 描述 了 一 种 使 用 序号 的 方法 ， 它 能 








够 完全 避免 重新 排序 问题 
3.5 面向 连接 的 运输 : TCP 


既然 我 们 已 经 学 习 了 可 靠 数 据 传输 的 基本 原理 ,我 们 就 可 以 转 而 学 习 TCP 了 。TCP 是 
因特网 运输 层 的 面向 连接 的 可 靠 的 运输 协议 。 我 们 在 本 ee 将 看 到 ， 为 了 提供 可 靠 数 ] ife 
输 ，TCP 依赖 于 前 一 节 所 讨论 的 许多 基本 原理 ， 其 中 包括 差错 检测 、 重 传 、 累 积 确认 、; 
时 器 以 及 用 于 序号 和 确认 号 的 首部 字段 。TCP 定义 在 RFC 793, RFC 1122, RFC 1323, 
RFC 2018 以 及 RFC 2581 中 


3.5.1 TCP 连接 


TCP 被 称 为 是 面向 连接 的 (connection- oriented ) ， 这 是 因为 在 一 个 应 用 进程 可 以 开始 
向 另 一 个 应 用 进程 发 送 数据 之 前 ， 这 两 个 进程 必须 先 相 互 “握手 ”， 即 它们 必须 相互 发 送 
某 些 预备 报 文 段 ， 以 建立 确 你 数据 伟 输 的 参数 。 作 为 TCP 连接 建立 的 一 部 分 ， 连 接 的 双方 
都 将 初始 化 与 TCP 连接 相关 的 许多 TCP 状态 变量 (其 中 的 许多 状态 变量 将 在 本 节 和 3.7 
季 中 讨论 ) 


Vinton Cerf 和 Robert Kahn 与 TCP/IP 


在 20 世纪 70 年 代 早 期 ， 分 组 交换 网 开始 飞速 增长 ， 而 因特网 的 前 身 ARPAnet 也 只 
是 当时 众多 分 组 交换 网 中 的 一 个 。 这 些 网 络 都 有 它们 各 自 的 协议 。 两 个 研究 人 员 Vinton 
Cerf 和 Robert Kahn 认识 到 互联 这 些 网 络 的 重要 性 ,发 明了 沟通 网 络 的 TCP/IP 协议 ， 该 
协议 代表 传输 控制 协议 /网 际 协 议 (Transmission Control Protocol/Internet Protocol), $% %8 
Cerf 和 Kahn 开始 时 把 该 协议 看 成 是 单一 的 实体 ， 但 是 后 来 将 它 分 成 单独 运行 的 两 个 部 
分 : TCP 和 IP, Cerf 和 Kahn Æ 1974 年 5 月 的 《IEEE Transactions on Communications 
Technology》 pews 了 一 篇 关于 TCP/IP 的 论文 [Cerf 1974 

TCP/IP 协议 是 当今 因特网 的 支柱 性 协议 ， 但 它 的 发 明 先 于 PC、 工作 站 、 智 能 手机 
和 平板 电脑 ， a 以 LAR , 4h, DSL, WiFi 和 其 他 接 入 网 技术 的 激增 ， 先 于 Web、 社 
交 媒 体 和 流 式 视频 等 。Cerf 和 Kahn 预见 到 了 对 于 联网 协议 的 需求 ， 一 方面 为 行将 定义 
的 应 用 提供 广泛 的 支持 ， 另 一 方面 允许 任何 主机 与 链 路 层 协 议 互 

2004 年 ，Cerf 和 Kahn 由 于 “联网 方面 的 开 si i 工作 (包括 因特网 的 基本 通信 协议 
TCP/IP 的 设计 和 实现 ) 以 及 联网 方面 富有 才能 导 ” 而 获得 ACM 图 灵 奖 ， 该 奖项 被 
RAK “tH RARE RX” 






这 种 TCP“ 连 接 ” 不 是 一 条 像 在 电路 交换 网 络 中 的 端 到 端 TDM 或 FDM 电路 。 相 反 ， 
该 “连接 ”是 一 条 逻辑 连接 ， 其 共同 状态 仅 保留 在 两 个 通信 端 系统 的 TCP 程序 中 。 前 面 
讲 过 ， 由 于 TCP 协议 只 在 端 系统 中 运行 ， 而 不 在 中 间 的 网 络 元 Zz (路 由 器 和 
BL) 中 运行 ， 所 以 中 间 的 网 络 元 素 不 会 维持 TCP 连接 状态 。 事 实 上， 中 间 路 由 器 对 TCP 
连接 完全 视而不见 ， 它 们 看 到 的 是 数据 报 ， 而 不 是 连接 











台 主 机 上 的 进程 B 存在 一 条 TCP 连接 ,那么 应 用 层 数据 就 可 在 从 进程 B 流向 进程 A 的 同 
时 ， 也 从 进程 A 流向 进程 B。TCP 连接 也 总 是 点 对 点 (point-to-point) 的 ， 即 在 单个 发 送 
方 与 单个 接收 方 之 间 的 连接 。 所 谓 “多 播 ” (参见 本 书 的 在 线 补充 材料 ) ， 即 在 一 次 发 送 
操作 中 ， 从 一 个 发 送 方 将 数据 传送 给 多 个 接收 方 ， 这 种 情况 对 TCP 来 说 是 不 可 能 的 。 对 于 
TCP 而 言 ， 两 台 主 机 是 一 对 ， 而 3 台 主 机 则 太 多 了 ! 

我 们 现在 来 看 看 TCP 连接 是 怎样 建立 的 。 假 设 运行 在 某 台 主机 上 的 一 个 进程 想 与 男 一 
台 主 机 上 的 一 个 进程 建立 一 条 连接 。 前 面 讲 过 ， 发 起 连接 的 这 个 进程 被 称 为 客户 进程 ， 而 
另 一 个 进程 被 称 为 服务 器 进程 。 该 客户 应 用 进程 首先 要 通知 客户 运输 层 ， 它 想 与 服务 器 上 
的 一 个 进程 建立 一 条 连接 。2. 7. 2 节 讲 过 ， 一 个 Python 客户 程序 通过 发 出 下 面 的 命令 来 实 
现 此 目的 。 


clientSocket.connect((serverName,serverPort) ) 


其 中 serverName 是 服务 器 的 名 字 ，serverPort 标识 了 服务 器 上 的 进程 。 客 户 上 的 TCP 
便 开 始 与 服务 器 上 的 TCP 建立 一 条 TCP 连接 。 我 们 将 在 本 节 后 面 更 为 详细 地 讨论 连接 建 
立 的 过 程 。 现 在 知道 下 列 事实 就 可 以 了 : 客户 首先 发 送 一 个 特殊 的 TCP 报 文 段 ， 服 务 器 用 
男 一 个 特殊 的 TCP 报 文 段 来 响应 ， 最 后 ， 客 户 再 用 第 三 个 特殊 报 文 段 作为 响应 。 前 两 个 报 
文 段 不 承载 “有 效 载荷 "， 也 就 是 不 包含 应 用 层 数据 ; 而 第 三 个 报 文 段 可 以 承载 有 效 载荷 。 
由 于 在 这 两 台 主 机 之 间 发 送 了 3 个 报 文 段 ， 所 以 这 种 连接 建立 过 程 常 被 称 为 三 次 握手 
( three-way handshake ) 。 

一 旦 建立 起 一 条 TCP 连接 ， 两 个 应 用 进程 之 间 就 可 以 相互 发 送 数据 了 。 我 们 考虑 一 下 
从 客户 进程 向 服务 器 进程 发 送 数 据 的 情况 。 如 2.7 节 中 所 述 ， 客 户 进 程 通过 套 接 字 (该 进 
程 之 门 ) 传递 数据 流 。 数 据 一 旦 通过 该 门 ， 它 就 由 客户 中 运行 的 TCP 控制 了 。 如 图 3-28 
所 示 ，TCP 将 这 些 数据 引导 到 该 连接 的 发 送 缓存 (send buffer) 里 ， 发 送 缓 存 是 发 起 三 次 
握手 期 间 设置 的 缓存 之 一 。 接 下 来 TCP 就 会 不 时 从 发 送 缓存 里 取出 一 块 数据 ， 并 将 数据 传 
递 到 网 络 层 。 有 趣 的 是 ， 在 TCP 规范 [RFC 793] 中 却 没 提 及 TCP 应 何 时 实际 发 送 缓存 里 
的 数据 ， 只 是 描述 为 “TCP 应 该 在 它 方便 的 时 候 以 报 文 段 的 形式 发 送 数据 " 。TCP 可 从 组 
存 中 取出 并 放 入 报 文 段 中 的 数据 数量 受 限于 最 大 报 文 段 长 度 (Maximum Segment Size, 
MSS), MSS 通常 根据 最 初 确定 的 由 本 地 发 送 主机 发 送 的 最 大 链 路 层 帧 长 度 〈 即 所 谓 的 最 
大 传输 单元 (Maximum Transmission Unit, MTU)) 来 设置 。 设 置 该 MSS 要 保证 一 个 TCP 
报 文 段 〈 当 封装 在 一 个 卫 数 据 报 中 ) 加 上 TCP/IP 首部 长 度 (通常 40 字 节 ) 将 适合 单个 
链 路 层 帧 。 以 太 网 和 PPP 链 路 层 协议 都 具有 1500 字 节 的 MTU, Att MSS 的 典型 值 为 1460 
字 节 。 已 经 提出 了 多 种 发 现 路 径 MTU 的 方法 ， 并 基于 路 径 MTU 值 设 置 MSS (路 径 MTU 
是 指 能 在 从 源 到 目的 地 的 所 有 链 路 上 发 送 的 最 大 链 路 层 帧 [RFC 1191 ] )。 注 意 到 MSS 是 
指 在 报 文 段 里 应 用 层 数 据 的 最 大 长 度 ， 而 不 是 指 包括 首部 的 TCP 报 文 段 的 最 大 长 度 。( 该 
术语 很 容易 混淆 ， 但 是 我 们 不 得 不 采用 它 ， 因 为 它 已 经 根深 蒂 固 了 。) 

TCP 为 每 块 客户 数据 配 上 一 个 TCP 首部 ， 从 而 形成 多 个 TCP 报 文 段 (TCP segment) 。 
这 些 报 文 段 被 下 传 给 网 络 屋 ， 网 络 层 将 其 分 别 封装 在 网 络 层 IP 数据 报 中 。 然 后 这 些 全数 
据 报 被 发 送 到 网 络 中 。 当 TCP 在 男 一 端 接 收 到 一 个 报 文 段 后 ， 该 报 文 段 的 数据 就 被 放 入 该 
TCP 连接 的 接收 缓存 中 ， 如 图 3-28 中 所 示 。 应 用 程序 从 此 缓存 中 读 取 数据 流 。 该 连接 的 
每 一 端 都 有 各 自 的 发 送 缓存 和 接收 缓存 。 (读者 可 以 参见 http://www. awl. com/kurose- ross 
处 的 在 线 流 控制 Java 小 程序 ， 它 提供 了 关于 发 送 缓存 和 接收 缓存 的 一 个 动画 演示 。) 





图 3-28 TCP 发 送 缓存 和 接收 缓存 


从 以 上 讨论 中 我 们 可 以 看 出 ，TCP 连接 的 组 成 包括 : 一 台 主 机 上 的 缓存 、 变 量 和 与 进 
程 连接 的 套 接 字 ， 以 及 另 一 台 主 机 上 的 另 一 组 缓存 、 变 量 和 与 进程 连接 的 套 接 字 。 如 前 面 
讲 过 的 那样 ， 在 这 两 台 主 机 之 间 的 网 络 元 素 (路 由 器 、 交 换 机 和 中 继 器 ) 中 ,没有 为 该 连 


接 分 配 任何 缓存 和 变量 。 
3.5.2 TCP 报 文 段 结构 


简要 地 了 解 了 TCP 连接 后 ， 我 们 研究 一 下 TCP 报 文 段 结构 。TCP 报 文 段 由 首部 字段 
和 -一 个 数据 字段 组 成 。 数 据 字段 包含 一 块 应 用 数据 。 如 前 所 述 ，MSS 限制 了 报 文 段 数据 字 
段 的 最 大 长 度 。 当 TCP 发 送 一 个 大 文件 ， 例 如 某 Web 页 面 上 的 一 个 图 像 时 ，TCP 通常 是 


将 该 文件 划分 成 长 度 为 MSS 的 若干 块 〈 最 
后 一 块 除外 ， 它 通常 小 于 MSS) 。 然 而 ， 交 
互 式 应 用 通常 传送 长 度 小 于 MSS 的 数据 块 。 
例如 ， 对 于 像 Telnet 这 样 的 远程 登录 应 用 ， 
FL TCP 报 文 段 的 数据 字段 经 常 只 有 一 个 字 
节 。 由 于 TCP 的 首部 一 般 是 20 字 节 ( 
UDP 首部 多 12 字 节 ) ， 所 以 Telnet 发 送 的 报 
文 段 也 许 只 有 21 字 节 长 。 

图 3-29 显示 了 TCP 报 文 段 的 结构 。 与 
UDP 一 样 ， 首 部 包括 源 端 口号 和 目的 端口 
号 ， 它 被 用 于 多 路 复 用 /分 解 来 自 或 送 到 上 


层 应 用 的 数据 。 另 外 ， 同 UDP 一 样 ，TCP | 


首部 也 包括 检验 和 字段 (checksum field)。 
TCP 报 文 段 首部 还 包含 下 列 字段 : 






32 比 特 
e] 


了 a è m ` t 
` t i % 
> 号 ir 
"7 j 


T 


3-29 TCP 报 文 段 结构 


e 32 比特 的 序号 字段 (sequence number field) 和 32 比特 的 确认 号 字段 (acknowl- 
edgment number field) 。 这 些 字段 被 TCP 发 送 方 和 接收 方 用 来 实现 可 靠 数 据 传输 服 


务 ， 讨 论 见 后 。 


。 16 比特 的 接收 窗口 字段 (receive window field) ， 该 字段 用 于 流量 控制 。 我 们 很 快 
就 会 看 到 ， 该 字段 用 于 指示 接收 方 愿意 接受 的 字 节 数量 。 

。 4 比特 的 首部 长 度 字 段 (header length field) ， 该 字段 指示 了 以 32 比特 的 字 为 单位 
的 TCP 首部 长 度 。 由 于 TO 选项 字段 的 原因 ，TCP 首部 的 长 度 是 可 变 的 。( 通常 ， 
选项 字段 为 空 ， 所 以 TCP 首部 的 典型 长 度 是 20 字 节 。) 
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e 可 选 与 变 长 的 选项 字段 (options field) ， 该 字段 用 于 发 送 方 与 接收 方 协商 最 大 报 文 
BKE (MSS) 时 ， 或 在 高 速 网 络 环境 下 用 作 窗 口 调节 因子 时 使 用 。 首 部 字段 中 
还 定义 了 一 个 时 间 惟 选项 。 可 参见 RFC 854 # RFC 1323 了 解 其 他 细节 。 
© 6 比特 的 标志 字段 (flag field), ACK 比特 用 于 指示 确认 字段 中 的 值 是 有 效 的 ， 即 
该 报 文 段 包括 一 个 对 已 被 成 功 接 收报 文 段 的 确认 。RST、SYN 和 FIN 比特 用 于 连 
接 建 立 和 拆除 ， 我 们 将 在 本 节 后 面 讨论 该 问题 。 在 明确 拥塞 通告 中 使 用 了 CWR 和 
ECE 比特 ， 如 3.7. 2 节 中 讨论 的 那样 。 当 PSH 比特 被 置 位 时 ， 就 指示 接收 方 应 立 
即将 数据 交 给 上 层 。 最 后 ，URG 比特 用 来 指示 报 文 段 里 存在 着 被 发 送 端的 上 层 实 
体 置 为 “紧急 ”的 数据 。 紧 急 数据 的 最 后 一 个 字 节 由 16 比特 的 紧急 数据 指针 字段 
(urgent data pointer field) 指出 。 当 紧急 数据 存在 并 给 出 指向 紧急 数据 尾 指 针 的 时 
候 ，TCP 必须 通知 接收 端的 上 层 实体 。( 在 实践 中 ，PSH、URG 和 紧急 数据 指针 并 
没有 使 用 。 为 了 完整 性 起 见 ， 我们 才 提 到 这 些 字段 。) 
作为 教师 的 经 验 是 ， 学 生 有 时 觉得 分 组 格式 的 讨论 相当 枯燥 ， 也 许 有 些 乏 味 。 特 别 是 
如 果 你 和 我 们 一 样 都 喜爱 乐高 玩具 ， 有 关 TCP 首部 的 有 趣 和 新 颖 的 讨论 请 参见 [Pomeranz 
2010] 。 
1. 序号 和 确认 号 


TCP 报 文 段 首部 中 两 个 最 重要 的 字段 是 序号 字段 和 确认 号 字段 。 这 两 个 字段 是 TCP 可 
靠 传 输 服务 的 关键 部 分 。 但 是 在 讨论 这 两 个 字段 是 如 何 用 于 提供 可 靠 数 据 传输 之 前 ， 我 们 
首先 来 解释 一 下 TCP 在 这 两 个 字段 中 究竟 放置 了 什么 。 

TCP 把 数据 看 成 一 个 无 结构 的 、 有 序 的 字 节 流 。 我 们 从 TCP 对 序号 的 使 用 上 可 以 看 出 
这 一 点 ， 因 为 序号 是 建立 在 传送 的 字 节 流 之 上 ， 而 不 是 建立 在 传送 的 报 文 段 的 序列 之 上 。 
一 个 报 文 段 的 序号 (sequence number for a segment) 因此 是 该 报 文 段 首 字 节 的 字 节 流 编号 。 
举例 来 说 ， 假 设 主 机 A 上 的 一 个 进程 想 通过 一 条 TCP 连接 向 主机 B 上 的 一 个 进程 发 送 一 
个 数据 流 。 主 机 A 中 的 TCP 将 隐 式 地 对 数据 流 中 的 每 一 个 字 节 编号 。 假 定数 据 流 由 一 个 
包含 500 000 字 节 的 文件 组 成 ， 其 MSS 为 1000 字 节 ， 数 据 流 的 首 字 节 编号 是 0。 如 图 3-30 
所 示 ， 该 TCP 将 为 该 数据 流 构建 500 个 报 文 段 。 给 第 一 个 报 文 段 分 配 序号 0， 第 二 个 报 文 
段 分 配 序号 1000， 第 三 个 报 文 段 分 配 序号 2000， 以 此 类 推 。 每 一 个 序号 被 十 人 到 相应 TCP 
报 文 段 首 部 的 序号 字段 中 。 


文件 
| 


| 第 一 个 报 文 段 的 数据 第 二 个 报 文 段 的 数据 
| | 
| i 











图 3-30 文件 数据 划分 成 TCP 报 文 段 


现在 我 们 考虑 一 下 确认 号 。 确 认 号 要 比 序号 难处 理 一 些 。 前 面 讲 过 ，TCP 是 全 双 工 的 ， 
因此 主机 A 在 向 主机 B 发 送 数据 的 同时 ， 也 许 也 接收 来 自主 机 B 的 数据 (都 是 同一 条 TCP 
连接 的 一 部 分 ) 。 从 主机 B 到 达 的 每 个 报 文 段 中 都 有 一 个 序号 用 于 从 了 B 流向 A 的 数据 。 主 机 
A 填充 进 报 文 段 的 确认 号 是 主机 A 期 望 从 主机 B 收 到 的 下 一 字 节 的 序号 。 看 一 些 例子 有 助 于 
理解 实际 发 生 的 事情 。 假设 主机 A 已 收 到 了 来 自主 机 B 的 编号 为 0 ~ 535 的 所 有 字 节 ， 同 时 
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假设 它 打算 发 送 一 个 报 文 段 给 主机 B。 主 机 A 等 待 主机 了 的 数据 流 中 字 节 536 及 之 后 的 所 有 
字 节 。 所 以 主机 A 就 会 在 它 发 往 主机 了 的 报 文 段 的 确认 号 字段 中 填 上 536. 

再 举 一 个 例子 ， 假 设 主机 A 已 收 到 一 个 来 自主 机 B 的 包含 字 节 0 ~ 535 的 报 文 段 ， 以 及 
另 一 个 包含 字 节 900 ~ 1000 的 报 文 段 。 由 于 某 种 原因 ， 主 机 A 还 没有 收 到 字 节 536 ~899 的 报 
文 段 。 在 这 个 例子 中 ， 主 机 A 为 了 重新 构建 主机 B 的 数据 流 ， 仍 在 等 待 字 节 536 (和 其 后 的 字 
节 )。 因 此 ，A 到 B 的 下 一 个 报 文 段 将 在 确认 号 字段 中 包含 536。 因 为 TCP 只 确认 该 流 中 至 第 一 
个 丢失 字 节 为 止 的 字 节 ， 所 以 TCP 被 称 为 提供 累积 确认 (cumulative acknowledgment) 。 

最 后 一 个 例子 也 会 引发 一 个 重要 而 微妙 的 问题 。 主 机 A 在 收 到 第 二 个 报 文 段 ( 字 节 
536 ~899) 之 前 收 到 第 三 个 报 文 段 ( 字 节 900 ~ 1000) 。 因 此 ， 第 三 个 报 文 段 失 序 到 达 。 
该 微妙 的 问题 是 ， 当 主机 在 一 条 TCP 连接 中 收 到 失 序 报 文 段 时 该 怎么 办 ? 有 趣 的 是 ，TCP 
RFC 并 没有 为 此 明确 规定 任何 规则 ， 而 是 把 这 一 问题 留 给 实现 TCP 的 编程 人 员 去 处 理 。 他 
们 有 两 个 基本 的 选择 : Q@ 接 收 方 立即 丢弃 失 序 报 文 段 (如 前 所 述 ， 这 可 以 简化 接收 方 的 设 
H); @@ 接 收 方 保留 失 序 的 字 节 ， 并 等 待 缺少 的 字 节 以 填补 该 间隔 。 显 然 ， 后 一 种 选择 对 
网 络 带 宽 而 言 更 为 有 效 ， 是 实践 中 采用 的 方法 。 

在 图 3-30 中 ， 我 们 假设 初始 序号 为 0。 事 实 上 ， 一 条 TCP 连接 的 双方 均 可 随机 地 选择 
初始 序号 。 这 样 做 可 以 减少 将 那些 仍 在 网 络 中 存在 的 来 自 两 台 主 机 之 间 先 前 已 终止 的 连接 
的 报 文 段 ， 误 认为 是 后 来 这 两 台 主 机 之 间 新 建 连接 所 产生 的 有 效 报 文 段 的 可 能 性 ( 它 碰巧 
与 旧 连 接 使 用 了 相同 的 端口 号 ) [Sunshine 1978 | 。 

2. Telnet: 序号 和 确认 号 的 一 个 学 习 案 例 

Telnet 由 RFC 854 定义 ， 它 现在 是 一 个 用 于 远程 登录 的 流行 应 用 层 协议 。 它 运行 在 
TCP 之 上 ， 被 设计 成 可 在 任意 一 对 主机 之 间 工 作 。Telnet 与 我 们 第 2 章 讨论 的 批量 数据 传 
输 应 用 不 同 ， 它 是 一 个 交互 式 应 用 。 我 们 在 此 讨论 一 个 Telnet 例子 ， 因 为 该 例子 很 好 地 阐述 
TCP 的 序号 与 确认 号 。 我 们 注意 到 许多 用 户 现 在 更 愿意 采用 SSH 协议 而 不 是 Telnet， 因 为 在 
Telnet 连接 中 发 送 的 数据 (包括 口令 !) 是 没有 加 密 的 ， 使 得 Tenet 易于 受到 窃听 攻击 (如 


在 8.7 节 中 讨论 的 那样 ) 。 主机 A 主机 B 
假设 主机 A 发 起 一 个 与 主机 B 的 Tel- 
net 会 话 。 因 为 是 主机 A 发 起 该 会 话 ， 因 


此 它 被 标记 为 客户 ， 而 主机 B 被 标记 为 E 

服务 器 。( 在 客户 端的 ) 用 户 键入 的 每 个 用户 刍 和 一 >42，acx 

字符 都 会 被 发 送 至 远程 主机 ; 远程 主机 将 se 

回 送 每 个 字符 的 副本 给 客户 ， 并 将 这 些 字 一 =; 主机 确认 

符 显示 在 Telnet 用 户 的 屏幕 上 。 这 种 “ 回 : el Re 

显 ”(echo back) 用 于 确保 由 Telnet 用 户 : NB i i 

发 送 的 字符 已 经 被 远程 主机 收 到 并 在 远程 ~~ f 

站 点 上 得 到 处 理 。 因 此 ， 在 从 用 户 击 键 到 收 到 回 旺 ; 

字符 被 显示 在 用 户 屏幕 上 这 段 时 间 内 ,每 e Sama, ak 

个 字符 在 网 络 中 传输 了 两 次 。 : tie! 
现在 假设 用 户 输 入 了 一 个 字符 'C '， : : 

然后 喝 起 了 咖啡 。 我 们 考察 一 下 在 客户 与 时 间 时 间 

服务 器 之 间 发 送 的 TCP 报 文 段 。 如 图 3-31 图 3-31 一 个 经 TCP 的 简单 Telnet 应 用 的 确认 号 和 序号 
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所 示 ， 假 设 客户 和 服务 器 的 起 始 序号 分 别 是 42 和 79。 前 面 讲 过 ， 一 个 报 文 段 的 序号 就 是 该 
报 文 段 数据 字段 首 字 节 的 序号 。 因 此 ， 客 户 发 送 的 第 一 个 报 文 段 的 序号 为 42， 服 务 器 发 送 
的 第 一 个 报 文 段 的 序号 为 79。 前 面 讲 过 ， 确 认 号 就 是 主机 正在 等 待 的 数据 的 下 一 个 字 节 序 
号 。 在 TCP 连接 建立 后 但 没有 发 送 任何 数据 之 前 ， 该 客户 等 待 字 节 79， 而 该 服务 器 等 待 
字 节 42。 

如 图 3-31 中 所 示 ， 共 发 送 3 个 报 文 段 。 第 一 个 报 文 段 是 由 客户 发 往 服 务 器 ， 在 它 的 
数据 字段 里 包含 一 字 节 的 字符 'C H ASCI 码 。 如 我 们 刚 讲 到 的 那样 ， 第 一 个 报 文 段 的 序 
号 字段 里 是 42。 另 外 ， 由 于 客户 还 没有 接收 到 来 自 服务 器 的 任何 数据 ， 因 此 该 第 一 个 报 文 
段 中 的 确认 号 字段 中 是 79。 

第 二 个 报 文 段 是 由 服务 器 发 往 客户 。 它 有 两 个 目的 : 首先 它 是 为 该 服务 器 所 收 到 数据 
提供 一 个 确认 。 通 过 在 确认 号 字段 中 填 人 43 ， 服 务 器 告诉 客户 它 已 经 成 功 地 收 到 字 节 和 
及 以 前 的 所 有 字 节 ， 现 在 正 等 待 着 字 节 43 的 出 现 。 该 报 文 段 的 第 二 个 目的 是 回 显 字 符 
'"C'。 因 此 ,在 第 二 个 报 文 段 的 数据 字段 里 填 和 人 的 是 字符 'C "的 ASCI 码 。 第 二 个 报 文 段 
的 序号 为 79， 它 是 该 TCP 连接 上 从 服务 器 到 客户 的 数据 流 的 起 始 序 号 ， 这 也 正 是 服务 器 
要 发 送 的 第 一 个 字 节 的 数据 。 值 得 注意 的 是 ， 对 客户 到 服务 器 的 数据 的 确认 被 装载 在 一 个 
承载 服务 器 到 客户 的 数据 的 报 文 段 中 ; 这 种 确认 被 称 为 是 被 撒 带 (piggybacked) 在 服务 器 
到 客户 的 数据 报 文 段 中 的 。 , 

第 三 个 报 文 段 是 从 客户 发 往 服务 器 的 。 它 的 唯一 目的 是 确认 已 从 服务 器 收 到 的 数据 。 
(前 面 讲 过 ， 第 二 个 报 文 段 中 包含 的 数据 是 字符 'C' ， 是 从 服务 器 到 客户 的 。) 该 报 文 段 的 
数据 字段 为 空 ( 即 确认 信息 没有 被 任何 从 客户 到 服务 器 的 数据 所 撒 带 ) 。 该 报 文 段 的 确认 
号 字段 填 人 的 是 80 ， 因 为 客户 已 经 收 到 了 字 节 流 中 序号 为 79 及 以 前 的 字 节 ， 它 现在 正 等 
待 着 字 节 80 的 出 现 。 你 可 能 认为 这 有 点 奇怪 ， 即 使 该 报 文 段 里 没有 数据 还 仍 有 序号 。 这 
是 因为 TCP 存在 序号 字段 ， 报 文 段 需 要 填 人 某 个 序号 。 


3.5.3 ”往返 时 间 的 估计 与 超时 


TCP 如 同 前 面 3. 4 节 所 讲 的 rdt 协议 一 样 ， 它 采用 超时 / 重 传 机 制 来 处 理 报 文 段 的 丢失 问 
题 。 尽 管 这 在 概念 上 简单 ， 但 是 当 在 如 TCP 这 样 的 实际 协议 中 实现 超时 / 重 传 机 制 时 还 是 会 
产生 许多 微妙 的 问题 。 也 许 最 明显 的 一 个 问题 就 是 超时 间隔 长 度 的 设置 。 显 然 ， 超 时 间隔 必 
须 大 于 该 连接 的 往返 时 间 (RIT) ， 即 从 一 个 报 文 段 发 出 到 它 被 确认 的 时 间 。 否 则 会 造成 不 
必要 的 重 传 。 但 是 这 个 时 间 间 隔 到 底 应 该 是 多 大 呢 ? 刚 开 始 时 应 如 何 估计 往返 时 间 呢 ? 是 否 
应 该 为 所 有 未 确认 的 报 文 段 各 设 一 个 定时 器 ? 问题 竟然 如 此 之 多 ! 我 们 在 本 节 中 的 讨论 基于 
[Jacobson 1988] 中 有 关 TCP 的 工作 以 及 IETF 关于 管理 TCP 定时 器 的 建议 [RFC 6298], 

1. 估计 往返 时 间 

我 们 开始 学 习 TCP 定时 器 的 管理 问题 ， 要 考虑 一 下 TCP 是 如 何 估计 发 送 方 与 接收 方 
之 间 往 返 时 间 的 。 这 是 通过 如 下 方法 完成 的 。 报 文 段 的 样本 RTT (表示 为 SampleRTT) 就 
是 从 某 报 文 段 被 发 出 〈 即 交 给 IP) 到 对 该 报 文 段 的 确认 被 收 到 之 间 的 时 间 量 。 大 多 数 TCP 
的 实现 仪 在 某 个 时 刻 做 一 次 SampleRTT 测量 ， 而 不 是 为 每 个 发 送 的 报 文 段 测量 一 个 Samp- 
leRTT。 这 就 是 说 ， 在 任意 时 刻 ， 仅 为 一 个 已 发 送 的 但 目前 尚未 被 确认 的 报 文 段 估计 Samp- 
leRTT， 从 而 产生 一 个 接近 每 个 RTT 的 新 SampleRTT 值 。 另 外 ，TCP 决 不 为 已 被 重 传 的 报 
文 段 计算 SampleRTT; 它 仅 为 传输 一 次 的 报 文 段 测量 SampleRTT [Kan 1987], (本章 后 面 
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的 一 个 习题 请 你 考虑 一 下 为 什么 要 这 么 做 。) 

显然 ， 由 于 路 由 器 的 拥塞 和 端 系统 负载 的 变化 ， 这 些 报 文 段 的 SampleRTT 值 会 随 之 波 
动 。 由 于 这 种 波动 ， 任 何 给 定 的 SampleRTT 值 也许 都 是 非典 型 的 。 因 此 ， 为 了 估计 一 个 典 
型 的 RTT， 自 然 要 采取 某 种 对 SampleRTT 取 平 均 的 办 法 。TCP 维持 一 个 SampleRTT 均值 
( 称 为 EstimatedRTT) 。 一 旦 获得 一 个 新 SampleRTT AY, TCP 就 会 根据 下 列 公 式 来 更 新 Esti- 
matedRTT : 

EstimatedRTT = (1 —a@) + EstimatedRTT +a@ + SampleRTT 

上 面 的 公式 是 以 编程 语言 的 语句 方式 给 出 的 ， 即 EstimatedRTT 的 新 值 是 由 以 前 的 Esti- 
matedRTT 值 与 SampleRTT 新 值 加 权 组 合 而 成 的 。 在 [RFC 6298] 中 给 出 的 a 推荐 值 是 
a@=0.125 ( 即 1/8)， 这 时 上 面 的 公式 变 为 : 

EstimatedRTT =0. 875 + EstimatedRTT +0. 125 + SampleRTT 

值得 注意 的 是 ，EstimatedRTT 是 一 个 SampleRTT 值 的 加 权 平 均值 。 如 在 本 章 后 面 习题 
中 讨论 的 那样 ， 这 个 加 权 平 均 对 最 近 的 样本 赋予 的 权 值 要 大 于 对 旧 样 本 赋予 的 权 值 。 这 是 
很 自然 的 ， 因 为 越 近 的 样本 越 能 更 好 地 反映 网 络 的 当前 拥塞 情况 。 从 统计 学 观点 讲 ， 这 种 
平均 被 称 为 指数 加 权 移 动 平均 (Exponential Weighted Moving Average，EWMA)。 在 EWMA 
中 的 “指数 ”一 词 看 起 来 是 指 一 个 给 定 的 SampleRTT 的 权 值 在 更 新 的 过 程 中 呈 指 数 型 快速 
衰减 。 在 课 后 习题 中 ， 将 要 求 你 推导 出 EstimatedRTT 的 指数 表达 形式 。 

图 3-32 显示 了 当 a =1/8 时 ， 在 gaia. cs. umass. edu (在 美国 马萨诸塞 州 的 Amherst) 
与 fantasia. eurecom. fr 〈 在 法 国 南 部 ) 之 间 的 一 条 TCP 连接 上 的 SampleRTT 值 与 Estimate- 
dRTT 值 。 显 然 ，SampleRTT 的 变化 在 EstimatedRTT 的 计算 中 趋 于 平缓 了 。 
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RTT (ms) 
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图 3-32 RTT 样本 和 RIT 估计 


除了 估算 RIT Sb, 测量 RIT 的 变化 也 是 有 价值 的 。 [RFC 6298] 定义 了 RIT 偏差 
DevRTT， 用 于 估算 SampleRTT 一 般 会 偏离 EstimatedRTT 的 程度 : 
DevRTT = (1 - 8) + DevRTT +8 - | SampleRTT ~ EstimatedRTT | 
注意 到 DevRTT 是 一 个 SampleRTT 45 EstimatedRTT 之 间 差 值 的 EWMA。 如 果 Samp- 
leRTT 值 波 动 较 小 ， 那 么 DevRTT 的 值 就 会 很 小 ; 另 一 方面 ， 如 果 波 动 很 大 ， 那 么 DevRTT 
的 值 就 会 很 大 。B 的 推荐 值 为 0. 25。 


2. 设置 和 管理 重 传 超时 间隔 


假设 已 经 给 出 了 EstimatedRTT 值 和 DevRTT 值 ， 那 么 TCP 超时 间隔 应 该 用 什么 值 呢 ? 
很 明显 ， 超 时 间隔 应 该 大 于 等 于 EstimatedRTT， 和 否则 ， 将 造成 不 必要 的 重 传 。 但 是 超时 间 
隔 也 不 应 该 比 EstimatedRTT 大 太 多 ， 和 否则 当 报 文 段 丢失 时 ，TCP 不 能 很 快 地 重 传 该 报 文 
段 ， 导 致 数据 传输 时 延 大 。 因 此 要 求 将 超时 间隔 设 为 EstimatedRTT 加 上 一 定 余 量 。 当 
SampleRTT 值 波动 较 大 时 ， 这 个 余 量 应 该 大 些 ; 当 波 动 较 小 时 ， 这 个 余 量 应 该 小 些 。 因 
此 ，DevRTT 值 应 该 在 这 里 发 挥 作用 了 。 在 TCP 的 确定 重 传 超时 间隔 的 方法 中 ， 所 有 这 些 
因素 都 考虑 到 了 : 

TimeoutInterval = EstimatedRTT +4 .DevRTT 

推荐 的 初始 TimeoutInterval 值 为 1 秒 [ RFC 6298]。 同 时 ， 当 出 现 超时 后 ，TimeoutInt- 
erval 值 将 加 倍 ， 以 免 即 将 被 确认 的 后 继 报 文 段 过 早出 现 超 时 。 然 而 ， 只 要 收 到 报 文 段 并 更 
新 EstimatedRTT, ， 就 使 用 上 述 公 式 再 次 计算 TimeoutInterval 。 





与 我 们 在 3.4 节 中 所 学 的 方法 很 像 ，TCP 通过 使 用 肯定 确认 与 定时 器 来 提供 可 靠 数 
据 传输 。TCP 确认 正确 接收 到 的 数据 ， 而 当 认 为 报 文 段 或 其 确认 报 文 丢 失 或 受 损 时 ， 
| TCP 会 重 传 这 些 报 文 段 。 有 些 版 本 的 TCP 还 有 一 个 隐 式 NAK 机 制 (A TCP 的 快速 重 传 
机 制 下 ， 收 到 对 一 个 特定 报 文 段 的 3 个 完 余 ACK 就 可 作为 对 后 面 报 文 段 的 一 个 隐 式 
NAK， 从 而 在 超时 之 前 触发 对 该 报 文 段 的 重 传 ) TCP 使 用 序号 以 使 接收 方 能 识别 丢失 
或 重复 的 报 文 段 。 像 可 靠 数据 传输 协议 rdta. 0 的 情况 一 样 ，TCP 自己 也 无 法 明确 地 分 辨 
一 个 报 文 段 或 其 ACK 是 丢失 了 还 是 受 损 了 ,或 是 时 延 过 长 了 。 在 发 送 方 ，TCP 的 响应 
是 相同 的 : 重 传 有 疑问 的 报 文 段 。 

TCP 也 使 用 流水 线 ， 使 得 发 送 方 在 任意 时 刻 都 可 以 有 多 个 已 发 出 但 还 未 被 确认 的 报 
文 段 存 在 。 我 们 在 前 面 已 经 看 到 ， 当 报 文 段 长 度 与 往返 时 延 之 比 很 小 时 ， 流水线 可 显著 
地 增加 一 个 会 话 的 吞吐 量 。 一 个 发 送 方 能 够 具有 的 未 被 确认 报 文 段 的 具体 数量 是 由 TCP 

的 流量 控制 和 拥塞 控制 机 制 决 定 的 。TCP 流量 控制 将 在 本 节 后 面 讨 论 ; TCP 拥塞 控制 将 
hes 7 节 中 讨论 。 此 时 我 们 只 需 知 道 TCP 发 送 方 使 用 了 流水 线 。 








3.5.4 可 靠 数据 传输 


前 面 讲 过 ， 因 特 网 的 网 络 层 服务 CIP ARS) 是 不 可 靠 的 。IP 不 保证 数据 报 的 交付 ， 
不 保证 数据 报 的 按 序 交付 ， 也 不 保证 数据 报 中 数据 的 完整 性 。 对 于 IP 服务， 数据 报 能 够 
溢出 路 由 器 缓存 而 永远 不 能 到 达 目 的 地 ， 数 据 报 也 可 能 是 乱 序 到 达 ， 而 且 数据 报 中 的 比特 
可 能 损坏 (由 0 变 为 1 或 者 相反 ) 。 由 于 运输 层 报 文 段 是 被 让 数据 报 携带 着 在 网 络 中 传输 
的 ， 所 以 运输 层 的 报 文 段 也 会 遇 到 这 些 问 题 。 

TCP 在 四 不 可 靠 的 尽力 而 为 服务 之 上 创建 了 一 种 可 靠 数 据 传输 服务 (reliable data 
transfer service), TCP 的 可 靠 数 据 传输 服务 确保 一 个 进程 从 其 接收 缓存 中 读 出 的 数据 流 是 
无 损坏 、 无 间隙 、 非 元 余 和 按 序 的 数据 流 ; 即 该 字 节 流 与 连接 的 另 一 方 端 系统 发 送出 的 字 
节 流 是 完全 相同 。TCP 提供 可 靠 数 据 传输 的 方法 涉及 我 们 在 3.4 节 中 所 学 的 许多 原理 。 

在 我 们 前 面 研发 可 靠 数据 传输 技术 时 ， 曾 假定 每 一 个 已 发 送 但 未 被 确认 的 报 文 段 都 与 一 
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个 定时 器 相关 联 ， 这 在 概念 上 是 最 简单 的 。 虽 然 这 在 理论 上 很 好 ， 但 定时 器 的 管理 却 需要 相 
当 大 的 开销 。 因 此 ， 推 荐 的 定时 器 管理 过 程 [RFC 6298] 仅 使 用 单一 的 重 传 定时 器 ， 即 使 有 
多 个 已 发 送 但 还 未 被 确认 的 报 文 段 。 在 本 节 中 描述 的 TCP 协议 遵循 了 这 种 单一 定时 器 的 推荐 。 
我 们 将 以 两 个 递增 的 步骤 来 讨论 TCP 是 如 何 提 供 可 靠 数据 传输 的 。 我 们 先 给 出 一 个 TCP 
发 送 方 的 高 度 简化 的 描述 ， 该 发 送 方 只 用 超时 来 恢复 报 文 段 的 丢失 ; 然后 再 给 出 一 个 更 全 面 
的 描述 ， 该 描述 中 除了 使 用 超时 机 制 外 ， 还 使 用 宛 余 确认 技术 。 在 接 下 来 的 讨论 中 ， 我 们 假 
定数 据 仅 向 一 个 方向 发 送 ， 即 从 主机 A 到 主机 B， 且 主机 A 在 发 送 一 个 大 文件 。 
图 3-33 给 出 了 一 个 TCP 发 送 方 高 度 简化 的 描述 。 我 们 看 到 在 TCP 发 送 方 有 3 个 与 发 

送 和 重 传 有 关 的 主要 事件 : 从 上 层 应 用 程序 接收 数据 ; 定时 器 超时 和 收 到 ACK。 一 旦 第 一 
个 主要 事件 发 生 ，TCP 从 应 用 程序 接收 数据 ， 将 数据 封装 在 一 个 报 文 段 中 ， 并 把 该 报 文 段 
ZA 卫 。 注 意 到 每 一 个 报 文 段 都 包含 一 个 序号 ， 如 3. 5. 2 节 所 讲 的 那样 ， 这 个 序号 就 是 该 
报 文 段 第 一 个 数据 字 节 的 字 节 流 编号 。 还 要 注意 到 如 果 定 时 器 还 没有 为 某 些 其 他 报 文 段 而 
运行 ， 则 当 报 文 段 被 传 给 IP H, TCP 就 启动 该 定时 器 。( 将 定时 器 想象 为 与 最 早 的 未 被 确 
认 的 报 文 段 相关 联 是 有 帮助 的 。) 该 定时 器 的 过 期 间隔 是 TimeoutInterval ， 它 是 由 3.5.3 节 
中 所 描述 的 EstimatedRTT 和 DevRTT 计算 得 出 的 。 

/* 假设 发 送 方 不 受 TCP 流 量 和 拥塞 控制 的 限制 ， 来自 上 层 数 据 的 长 度 小 于 MSS， 且 数据 传送 只 在 -- 个 

方向 进行 。*/ 

NextSeqNum=InitialSeqNumber 

SendBase=InitialSeqNumber 

loop (xi) { 

switch (事件 ) 


事件 ; 从 上 面 应 用 程序 接收 到 数据 e 
生成 具有 序号 NextSeqNum 的 TCP 报 文 段 
if (定时 器 当前 没有 运行 ) 
启动 定时 器 
向 IPB 传递 报 文 段 
NextSeqnum=NextSeqNumt+length (data) 


break; 


事件 : 定时 器 超时 
重 传 具 有 最 小 序号 但 仍 未 应 答 的 报 文 段 
启动 定时 器 
break; 
事件 : 收 到 ACK， 具 有 RCK 字 段 值 Y 
if (y > SendBase) { 
SendBase=y 


if (当前 仍 无 任何 应 答 报 文 段 ) 
启动 定时 器 


break; 


} /* 结束 永远 循环 */ 





3-33 简化 的 TCP 发 送 方 


第 二 个 主要 事件 是 超时 。TCP 通过 重 传 引起 超时 的 报 文 段 来 响应 超时 事件 。 然 后 TCP 
重启 定时 器 。 
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TCP 发 送 方 必 须 处 理 的 第 三 个 主要 事件 是 ， 到 达 一 个 来 自 接收 方 的 确认 报 文 段 ( ACK) 
(更 确切 地 说 ， 是 一 个 包含 了 有 效 ACK 字段 值 的 报 文 段 ) 。 当 该 事件 发 生 时 ，TCP 将 ACK 的 
值 y 与 它 的 变量 SendBase 进行 比较 。TCP 状态 变量 SendBase 是 最 早 未 被 确认 的 字 节 的 序号 。 
(因此 SendBase -1 是 指 接收 方 已 正确 按 序 接收 到 的 数据 的 最 后 一 个 字 节 的 序号 。) 如 前 面 指 
出 的 那样 ，TCP 采用 累积 确认 ， 所 以 y 确认 了 字 节 编号 在 y 之 前 的 所 有 字 节 都 已 经 收 到 。 如 
果 y >SendBase， 则 该 ACK 是 在 确认 一 个 或 多 个 先前 未 被 确认 的 报 文 段 。 因 此 发 送 方 更 新 它 
的 SendBase 变量 ; 如 果 当 前 有 未 被 确认 的 报 文 段 ，TCP 还 要 重新 启动 定时 器 。 

1. 一 些 有 趣 的 情况 


我 们 刚刚 描述 了 一 个 关于 TCP 如 何 提供 可 靠 数 据 传输 的 高 度 简化 的 版 本 。 但 即使 这 种 
高 度 简化 的 版 本 ， 仍 然 存在 着 许多 微妙 之 处 。 为 了 较 好 地 感受 该 协议 的 工作 过 程 ， 我 们 来 
看 几 种 简单 情况 。 图 3-34 描述 了 第 一 种 情况 ， 主 机 A 向 主机 B 发 送 一 个 报 文 段 。 假 设 该 
报 文 段 的 序号 是 92 ， 而 且 包含 8 字 节 数据 。 在 发 出 该 报 文 段 之 后 ， 主 机 A 等 待 一 个 来 自 
主机 B 的 确认 号 为 100 HIRI, BAA 发 出 的 报 文 段 在 主机 B 上 被 收 到 , 但 从 主机 B 
发 往 主 机 A 的 确认 报 文 丢失 了 。 在 这 种 情况 下 ， 超 时 事件 就 会 发 生 ， 主 机 A 会 重 传 相同 
的 报 文 段 。 当 然 ， 当 主机 B 收 到 该 重 传 的 报 文 段 时 ， 它 将 通过 序号 发 现 该 报 文 段 包 含 了 早 
已 收 到 的 数据 。 因 此 ， 主 机 B 中 的 TCP 将 丢弃 该 重 传 的 报 文 段 中 的 这 些 字 节 。 

在 第 二 种 情况 中 ， 如 图 3-35 所 示 ， 主 机 A 连续 发 回 了 两 个 报 文 段 。 第 一 个 报 文 段 序号 
是 92， 包 含 8 字 节 数据 ; 第 二 个 报 文 段 序 号 是 100， 包含 20 字 节 数据 。 假 设 两 个 报 文 段 都 完 
好 无 损 地 到 达 主 机 B， 并 且 主 机 B 为 每 一 个 报 文 段 分 别 发 送 一 个 确认 。 第 一 个 确认 报 文 的 确 
认 号 是 100， 第 二 个 确认 报 文 的 确认 号 是 120。 现 在 假设 在 超时 之 前 这 两 个 报 文 段 中 没有 一 个 
确认 报 文 到 达 主 机 A。 当 超时 事件 发 生 时 ， 主 机 A 重 传 序 号 92 的 第 一 个 报 文 段 ， 并 重启 定 
时 器 。 只 要 第 二 个 报 文 段 的 ACK 在 新 的 超时 发 生 以 前 到 达 ， 则 第 二 个 报 文 段 将 不 会 被 重 传 。 

主机 A 主机 B 主机 A 主机 B 


> a : Seg ~ | 
: Seq = 92, karn : Myopa E 
: : :一 ss ~ 109, 20m : 


Seq = 92 : 


"oh 3 Eo n 
s A à : 
: X : : 


(BH) 


: Seg = 95 : : 
: < SF HH ap $ : 
Wee Seq = 92 : 





时 间 时 间 a efi 
图 3-34 由 于 确认 丢失 而 重 传 3-35 报 文 段 100 没有 重 传 
在 第 三 种 也 是 最 后 一 种 情况 中 ,假设 主机 A 与 在 第 二 种 情况 中 完全 一 样 ， 发 送 两 个 报 
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文 段 。 第 一 个 报 文 段 的 确认 报 文 在 网 络 丢失 ， 但 在 超时 事件 发 生 之 前 主机 A 收 到 一 个 确认 
号 为 120 的 确认 报 文 。 主 机 A 因而 知道 主机 了 已 经 收 到 了 序号 为 119 及 之 前 的 所 有 字 节 ; 
所 以 主机 A 不 会 重 传 这 两 个 报 文 段 中 的 任何 主机 A 主机 B 


一 个 。 这 种 情况 在 图 3-36 中 进行 了 图 示 。 
2. 超时 间隔 加 倍 


我 们 现在 讨论 一 下 在 大 多 数 TCP 实现 中 
所 做 的 一 些 修 改 。 首 先 关注 的 是 在 定时 器 时 : 
限 过 期 后 超时 间隔 的 长 度 。 在 这 种 修改 中 ， : _ 100 
每 当 超时 事件 发 生 时 ， 如 前 所 述 ，TCP Eë ee 
具有 最 小 序号 的 还 未 被 确认 的 报 文 段 。 只 是 ETS 


每 次 TCP 重 传 时 都 会 将 下 一 次 的 超时 间隔 设 ant ha : jet eel : 
为 先前 值 的 两 倍 ， 而 不 是 用 从 EstimatedRTT : : 
和 DevRTT 推算 出 的 值 (如 在 3.5.3 节 中 所 ; : 
描述 的 ) 。 例 如 ， 假 设 当 定时 器 第 一 次 过 期 
时 ， 与 最 早 的 未 被 确认 的 报 文 段 相 关联 的 
TimeoutInterval 是 0.75 秒 。TCP 就 会 重 传 该 
报 文 段 ， 并 把 新 的 过 期 时 间 设 置 为 1.5 秒 。 $ $ 
如 果 1.5 秒 后 定时 器 又 过 期 了 ， 则 TCP 将 再 时 间 时 间 
次 重 传 该 报 文 跋 ， 并 把 过 期 时 间 设 置 为 3.0 图 3-36 累积 确认 避免 了 第 一 个 报 文 段 的 重 传 
秒 。 因 此 ， 超 时 间隔 在 每 次 重 传 后 会 呈 指 数 型 增长 。 然 而 ， 每 当 定时 器 在 另 两 个 事件 ( 即 
收 到 上 层 应 用 的 数据 和 收 到 ACK) 中 的 任意 一 个 启动 时 ，TimeoutInterval 由 最 近 的 Estimat- 
edRTT 值 与 DevRTT 值 推算 得 到 。 

这 种 修改 提供 了 一 个 形式 受 限 的 拥塞 控制 。( 更 复杂 的 TCP 拥塞 控制 形式 将 在 3.7 节 
中 学 习 。) 定时 器 过 期 很 可 能 是 由 网 络 拥塞 引起 的 ， 即 太 多 的 分 组 到 达 源 与 目的 地 之 间 路 
径 上 的 一 台 (或 多 台 ) 路 由 器 的 队列 中 ,造成 分 组 丢失 或 长 时 间 的 排队 时 延 。 在 拥塞 的 时 
候 ， 如 果 源 持续 重 传 分 组 ， 会 使 拥塞 更 加 严重 。 相 反 ，TCP 使 用 更 文雅 的 方式 ， 每 个 发 送 
方 的 重 传 都 是 经 过 越 来 越 长 的 时 间 间 隔 后 进行 的 。 当 我 们 在 第 6 章 学 习 CSMA/CD 时 ,将 
看 到 以 太 网 采用 了 类 似 的 思路 。 

3. 快速 重 传 


超时 触发 重 传 存 在 的 问题 之 一 是 超时 周期 可 能 相对 较 长 。 当 一 个 报 文 段 丢失 时 ， 
这 种 长 超时 周期 迫使 发 送 方 延迟 重 传 丢失 的 分 组 ， 因 而 增加 了 端 到 端 时 延 。 幸 运 的 
是 ,发 送 方 通常 可 在 超时 事件 发 生 之 前 通过 注意 所 谓 匈 余 ACK 来 较 好 地 检测 到 丢 包 
情况 。 宛 余 ACK (duplicate ACK) 就 是 再 次 确认 某 个 报 文 段 的 ACK， 而 发 送 方 先前 
已 经 收 到 对 该 报 文 段 的 确认 。 要 理解 发 送 方 对 元 余 ACK 的 响应 ， 我 们 必须 首先 看 一 
下 接收 方 为 什么 会 发 送 元 余 ACK。 表 3-2 Ati T TCP 接收 方 的 ACK 生成 策略 [RFC 
5681] 。 当 TCP 接收 方 收 到 一 个 具有 这 样 序号 的 报 文 段 时 ， 即 其 序号 大 于 下 一 个 所 期 
望 的 、 按 序 的 报 文 段 ， 它 检测 到 了 数据 流 中 的 一 个 间隔 ， 这 就 是 说 有 报 文 段 丢失 。 这 
个 间隔 可 能 是 由 于 在 网 络 中 报 文 段 丢失 或 重新 排序 造成 的 。 因 为 TCP 不 使 用 否定 确 
认 ， 所 以 接收 方 不 能 向 发 送 方 发 回 一 个 显 式 的 否定 确认 。 相 反 ， 它 只 是 对 已 经 接收 到 
的 最 后 一 个 按 序 字 节 数 据 进行 重复 确认 〈 即 产生 一 个 宛 余 ACK) 即 可 。 (注意 到 在 


|; Seg ~ 92, EES ee : 











表 3-2 中 人 允许 接收 方 不 丢弃 失 序 报 文 段 。) 


表 3-2 产生 TCP ACK 的 建议 [RFC 5681 ] 
事件 TCP 接收 方 动作 


具有 所 期 望 序号 的 按 序 报 文 段 到 达 。 所 | ”延迟 的 ACK。 对 另 一 个 按 序 报 文 段 的 到 达 最 多 等 待 500ms。 如 果 下 
有 在 期 望 序号 及 以 前 的 数据 都 已 经 被 确认 | 一 个 按 序 报 文 段 在 这 个 时 间 间 隔 内 没有 到 达 ， 则 发 送 一 个 ACK 


具有 所 期 望 序号 的 按 序 报 文 段 到 达 。 另 立即 发 送 单个 累积 ACK， 以 确认 两 个 按 序 报 文 段 
一 个 按 序 报 文 段 等 待 ACK 传输 


比 期 望 序号 大 的 失 序 报 文 段 到 达 。 检 测 立即 发 送 元 余 ACK， 指 示 下 一 个 期 待 字 节 的 序号 (其 为 间隔 的 低 端 
出 间隔 的 序号 ) 


能 部 分 或 完全 填充 接收 数据 间隔 的 报 文 | “倘若 该 报 文 段 起 始 于 间隔 的 低 端 ， 则 立即 发 送 ACK 
段 到 达 








因为 发 送 方 经 常 一 个 接 一 个 地 发 送 大 量 的 报 文 段 ， 如 果 一 个 报 文 段 委 失 ， 就 很 可 能 引 
起 许多 一 个 接 一 个 的 宛 余 ACK, WSR TCP 发 送 方 接收 到 对 相同 数据 的 3 个 元 余 ACK， 它 
把 这 当 作 一 种 指示 ， 说 明 跟 在 这 个 已 被 确认 过 3 次 的 报 文 段 之 后 的 报 文 段 已 经 丢失 。 (在 
课 后 习题 中 ,我 们 将 考虑 为 什么 发 送 方 等 待 3 个 匈 余 ACK， 而 不 是 仅仅 等 待 一 个 元 余 
ACK.) 一 旦 收 到 3 AIA ACK, TCP 就 执行 快速 重 传 (fast retransmit) [RFC 5681]， 即 
在 该 报 文 段 的 定时 器 过 期 之 前 重 传 丢 失 的 报 文 段 。 对 于 采用 快速 重 传 的 TCP， 可 用 下 列 代 
码 片段 代替 图 3-33 中 的 ACK 收 到 事件 : 
B+: 收 到 ACK, 具有 RACK 字 段 值 y 
if (y > SendBase) { 
SendBase=y 
if (当前 仍 无 任何 应 答 报 文 段 ) 
启动 定时 器 
ee {/* t LBA YAR CY —ITARACK */ 
对 y 收 到 的 宛 余 ACK 数 加 1 
1f (对 y==3 收 到 的 元 余 ACK 数 ) 
/* TCP 快 速 重 传 */ 
重新 发 送 具 有 序号 Y 的 报 文 段 


} 
break; 


前 面 讲 过 ， 当 在 如 TCP 这 样 一 个 实际 协议 中 实现 超时 / 重 传 机 制 时 ， 会 产生 许多 微妙 
的 问题 。 上 面 的 过 程 是 在 超过 20 年 的 TCP 定时 器 使 用 经 验 的 基础 上 演化 而 来 的 ， 读 者 应 
当 理解 实际 情况 确实 是 这 样 的 。 

4. 是 回 退 N 步 还 是 选择 重 传 

考虑 下 面 这 个 问题 来 结束 有 关 TCP 差错 恢复 机 制 的 学 习 : TCP 是 一 个 GBN 协议 还 是 
一 个 SR 协议 ?前 面 讲 过 ，TCP 确认 是 累积 式 的 ， 正 确 接收 但 失 序 的 报 文 段 是 不 会 被 接收 
方 逐个 确认 的 。 因 此 ， 如 图 3-33 所 示 (也 可 参见 图 3-19) TCP 发 送 方 仅 需 维持 已 发 送 过 
但 未 被 确认 的 字 节 的 最 小 序号 (SendBase) 和 下 一 个 要 发 送 的 字 节 的 序号 
(NextSeqNum) 。 在 这 种 意义 下 ，TCP 看 起 来 更 像 一 个 CBN 风格 的 协议 。 但 是 TCP 和 GBN 
协议 之 间 有 着 一 些 显著 的 区 别 。 许 多 TCP 实现 会 将 正确 接收 但 失 序 的 报 文 段 缓存 起 来 
[Stevens 1994]。 另 外 考虑 一 下 ， 当 发 送 方 发 送 的 一 组 报 文 段 1，2，…，N， 并且 所 有 的 
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报 文 段 都 按 序 无 差错 地 到 达 接 收 方 时 会 发 生 的 情况 。 进 一 步 假 设 对 分 组 n < N 的 确认 报 文 
EK, BÆRER N -1 个 确认 报 文 在 分 别 超 时 以 前 到 达 发 送 端 ， 这 时 又 会 发 生 的 情况 。 在 
该 例 中 ，GBN 不 仅 会 重 传 分 组 n, LAH 主机 A 主机 B 

传 所 有 后 继 的 分 组 n+1, n+2, =, No E D 

在 另 一 方面 ，TCP 将 重 传 至 多 一 个 报 文 i 
段 ， 即 报 文 段 n。 此 外 ， 如 果 对 报 文 段 n + 

1 的 确认 报 文 在 报 文 段 n 超时 之 前 到 达 ， 
TCP 甚至 不 会 重 传 报 文 段 n。 

对 TCP 提出 的 一 种 修改 意见 是 所 谓 的 
选择 确认 (selective acknowledgment) [ RFC 
2018]， 它 允许 TCP 接收 方 有 选择 地 确认 
失 序 报 文 段 ， 而 不 是 累积 地 确认 最 后 一 个 
正确 接收 的 有 序 报 文 段 。 当 将 该 机 制 与 选 
择 重 传 机 制 结合 起 来 使 用 时 ( 即 跳 过 重 传 
那些 已 被 接收 方 选 择 性 地 确认 过 的 报 文 : 
BE), TCP 看 起 来 就 很 像 我 们 通常 的 SR 协 起 时 -| : 


:ack=100 


:ack=100 
+ ack=100 
;ack=100 








议 。 因 此 ，TCP 的 差错 恢复 机 制 也 许 最 好 2004 
被 分 类 为 CBN 协议 与 SR 协议 的 混合 体 。 Sig 
3.5.5 流量 控制 |: : 
v y 
前 面 讲 过 ， 一 条 TOP 连接 的 每 一 侧 主 时 间 时 间 
机 都 为 该 连接 设置 了 接收 缓存 。 当 该 TCP 图 3-37 快速 重 传 : 在 某 报 文 段 的 定时 器 过 期 
连接 收 到 正确 、 按 序 的 字 节 后 ， 它 就 将 数 之 前 重 传 丢 失 的 报 文 自 


据 放 和 人 接收 缓存 。 相 关联 的 应 用 进程 会 从 该 缓存 中 读 取 数据 ， 但 不 必 是 数据 刚 一 到 达 就 立 
即 读 取 。 事 实 上 ， 接 收 方 应 用 也 许 正 忙 于 其 他 任务 ， 甚 至 要 过 很 长 时 间 后 才 去 读 取 该 数 
据 。 如 果 某 应 用 程序 读 取 数 据 时 相对 缓慢 ， 而 发 送 方 发 送 得 太 多 、 太 快 ， 发 送 的 数据 就 会 
很 容易 地 使 该 连接 的 接收 缓存 溢出 。 

TCP 为 它 的 应 用 程序 提供 了 流量 控制 服务 (flow- control service) 以 消除 发 送 方 使 接收 
方 缓存 溢出 的 可 能 性 。 流 量 控制 因此 是 一 个 速度 匹配 服务 ， 即 发 送 方 的 发 送 速率 与 接收 方 
应 用 程序 的 读 取 速率 相 匹配 。 前 面 提 到 过 ，TCP 发 送 方 也 可 能 因为 IP 网 络 的 拥塞 而 被 过 
制 ; 这 种 形式 的 发 送 方 的 控制 被 称 为 拥塞 控制 (congestion control) ， 我 们 将 在 3.6 节 和 
3.7 节 详 细 地 讨论 这 个 主题 。 即 使 流量 控制 和 拥塞 控制 采取 的 动作 非常 相似 (对 发 送 方 的 
遏制 ) ， 但 是 它们 显然 是 针对 完全 不 同 的 原因 而 采取 的 措施 。 不 幸 的 是 ， 许 多 作者 把 这 两 
个 术语 混用 ， 理 解 力 强 的 读者 会 明智 地 区 分 这 两 种 情况 。 现 在 我 们 来 讨论 TCP 如 何 提 供 流 
量 控制 服务 的 。 为 了 能 从 整体 上 看 问题 ， 我 们 在 本 节 都 假设 TCP 是 这 样 实现 的 ， 即 TCP 
接收 方 丢弃 失 序 的 报 文 段 。 

TCP 通过 让 发 送 方 维护 一 个 称 为 接收 窗口 (receive window) 的 变量 来 提供 流量 控制 。 
通俗 地 说 ， 接 收 窗口 用 于 给 发 送 方 一 个 指示 一 一 该 接收 方 还 有 多 少 可 用 的 缓存 空间 。 因 为 
TCP 是 全 双 工 通信 ， 在 连接 两 端的 发 送 方 都 各 自 维 护 一 个 接收 窗口 。 我 们 在 文件 传输 的 情 
况 下 研究 接收 窗口 。 假 设 主机 A 通过 一 条 TCP 连接 向 主机 B 发 送 一 个 大 文件 。 主 机 B 为 
该 连接 分 配 了 一 个 接收 缓存 ， 并 用 RevBuffer 来 表示 其 大 小 。 主 机 B 上 的 应 用 进程 不 时 地 





从 该 缓存 中 读 取 数据 。 我 们 定义 以 下 变量 : 

e LastByteRead: 主机 B 上 的 应 用 进程 从 缓存 读 出 的 数据 流 的 最 后 一 个 字 节 的 编号 。 

è LastByteRcvd: 从 网 络 中 到 达 的 并 且 已 放 入 主机 B 接收 缓存 中 的 数据 流 的 最 后 一 个 

字 节 的 编号 。 
由 于 TCP 不 允许 已 分 配 的 缓存 溢出 ， 下 式 必 须 成 立 : 
LastByteRcvd - LastByteRead < RevBuffer 
接收 窗口 用 rwnd 表示 ， 根 据 缓存 可 用 空间 的 数量 来 设置 : 
rwnd = RevBuffer — [ LastByteRevd - LastByteRead | 

由 于 该 空间 是 随 着 时 间 变 化 的 ， 所 以 rwnd 是 动态 的 。 图 3-38 对 变量 rwnd 进行 了 
图 示 。 

连接 是 如 何 使 用 变量 rwnd 来 提供 流 
量 控制 服务 的 呢 ? ELB 通过 把 当前 的 
rwnd 值 放 入 它 发 给 主机 A 的 报 文 段 接收 
窗口 字段 中 ， 通 知 主机 A CBE fae 
存 中 还 有 多 少 可 用 空间 。 开 始 时 ， 主 机 B 
设 定 rwnd = RevBuffer。 注 意 到 为 了 实现 这 
一 点 ， 主 机 B 必须 跟踪 几 个 与 连接 有 关 的 
变量 。 图 3-38 接收 窗口 (rwnd) 和 接收 缓存 ( RevBuffer) 

主机 A 轮流 跟踪 两 个 变量 ，LastByteSent 和 LastByteAcked， 这 两 个 变量 的 意义 很 明显 。 
注意 到 这 两 个 变量 之 间 的 差 LastByteSent - LastByteAcked， 就 是 主机 A 发 送 到 连接 中 但 未 
被 确认 的 数据 量 。 通 过 将 未 确认 的 数据 量 控制 在 值 rwnd 以 内 ， 就 可 以 保证 主机 A 不 会 使 
主机 B 的 接收 缓存 溢出 。 因 此 ， 主 机 A 在 该 连接 的 整个 生命 周期 须 保 证 : 

LastByteSent - LastByteAcked < rwnd 
对 于 这 个 方案 还 存在 一 个 小 小 的 技术 问题 。 为 了 理解 这 一 点 ， 假 设 主 机 B 的 接收 组 

存 已 经 存 满 ， 使 得 rwnd =0。 在 将 rwnd =0 通告 给 主机 A 之 后 ， 还 要 假设 主机 B 没有 任 
何 数据 要 发 给 主机 A。 此 时 ， 考 虑 会 发 生 什么 情况 。 因 为 主机 了 B 上 的 应 用 进程 将 缓存 清 
Z, TCP 并 不 向 主机 A 发 送 带 有 rwd 新 值 的 新 报 文 段 ; 事实 上 ，TCP 仅 当 在 它 有 数据 
或 有 确认 要 发 时 才 会 发 送 报 文 段 给 主机 A。 这 样 ， 主 机 A 不 可 能 知道 主机 B 的 接收 缓存 
已 经 有 新 的 空间 了 ， 即 主机 A 被 阻塞 而 不 能 再 发 送 数据 ! 为 了 解决 这 个 问题 ，TCP 规范 
中 要 求 : 当主 机 B 的 接收 窗口 为 0 时， 主机 A 继续 发 送 只 有 一 个 字 节 数据 的 报 文 段 。 这 
些 报 文 段 将 会 被 接收 方 确认 。 最 终 缓 存 将 开始 清空 ， 并 且 确 认 报 文 里 将 包含 一 个 非 0 的 
rwnd 值 。 

位 于 http://www. awl. com/kurose- ross 的 在 线 站 点 为 本 书 提供 了 一 个 交互 式 Java 小 程 
序 ， 用 以 说 明 TCP 接收 窗口 的 运行 情况 。 

描述 了 TCP 的 流量 控制 服务 以 后 ,我 们 在 此 要 简要 地 提 一 下 UDP 并 不 提供 流量 控制 ， 
报 文 段 由 于 缓存 溢出 可 能 在 接收 方 丢 失 。 例 如 ， 考 虑 一 下 从 主机 A 上 的 一 个 进程 向 主机 B 
上 的 一 个 进程 发 送 一 系列 UDP 报 文 段 的 情形 。 对 于 一 个 典型 的 UDP 实现 ，UDP 将 在 一 个 
有 限 大 小 的 缓存 中 加 上 报 文 段 ， 该 缓存 在 相应 套 接 字 (进程 的 门户 ) “之 前 ”。 进 程 每 次 
从 缓存 中 读 取 一 个 完整 的 报 文 段 。 如 果 进 程 从 缓存 中 读 取 报 文 段 的 速度 不 够 快 ， 那 么 缓存 
将 会 溢出 ， 并 且 将 丢失 报 文 段 。 


RevBuffer 
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3.5.6 TCP 连接 管理 


在 本 小 节 中 ， 我 们 更 为 仔细 地 观察 如 何 建立 和 拆除 一 条 TCP 连接。 尽管 这 个 主题 并 不 
特别 令 人 兴奋 ， 但 是 它 很 重要 ， 因 为 TCP 连接 的 建立 会 显著 地 增加 人 们 感受 到 的 时 延 
(如 在 Web 上 冲浪 时 )。 此 外 ， 许多 常见 的 网 络 攻击 (包括 极为 流行 的 SYN 洪 泛 攻击 ) 利 
用 了 TCP 连接 管理 中 的 弱点 。 现 在 我 们 观察 一 下 一 条 TCP 连接 是 如 何 建立 的 。 假 设 运行 
在 一 台 主 机 (BP) 上 的 一 个 进程 想 与 另 一 台 主 机 (MS) 上 的 一 个 进程 建立 一 条 连 
接 。 客 户 应 用 进程 首先 通知 客户 TCP， 它 想 建立 一 个 与 服务 器 上 某 个 进程 之 间 的 连接 。 客 
户 中 的 TCP 会 用 以 下 方式 与 服务 器 中 的 TCP 建立 一 条 TCP 连接 : 

e 第 一 步 : 客户 端的 TCP 首先 向 服务 器 端的 TCP 发 送 一 个 特殊 的 TCP 报 文 段 。 该 报 

文 段 中 不 包含 应 用 层 数据 。 但 是 在 报 文 段 的 首部 (SILA 3-29) 中 的 一 个 标志 位 
( 即 SYN 比特 ) 被 置 为 1。 因 此 ， 这 个 特殊 报 文 段 被 称 为 SYN 报 文 段 。 男 外 ， 客 
户 会 随机 地 选择 一 个 初始 序号 (client_isn) ， 并 将 此 编号 放置 于 该 起 始 的 TCP SYN 
报 文 段 的 序号 字段 中 。 该 报 文 段 会 被 封装 在 一 个 卫 数据 报 中 ， 并 发 送 给 服务 器 。 
为 了 避免 某 些 安全 性 攻击 ， 在 适当 地 随机 化 选择 client_isn 方面 有 着 不 少 有 趣 的 研 
究 [CERT 2001-09] 。 

e 第 二 步 : 一 旦 包含 TCP SYN 报 文 段 的 卫 数据 报到 达 服 务 器 主机 (假定 它 的 确 到 达 
了 !) ， 服 务 器 会 从 该 数据 报 中 提取 出 TCP SYN 报 文 段 ， 为 该 TCP 连接 分 配 TCP 组 
存 和 变量 ， 并 向 该 客户 TCP 发 送 允 许 连接 的 报 文 段 。( 我 们 将 在 第 8 章 看 到 ， 在 完 
成 三 次 握手 的 第 三 步 之 前 分 配 这 些 缓存 和 变量 ,使 得 TCP 易于 受到 称 为 SYN 洪 泛 
的 拒绝 服务 攻击 。) 这 个 允许 连接 的 报 文 段 也 不 包含 应 用 层 数 据 。 但 是 ， 在 报 文 段 
的 首部 却 包含 3 个 重要 的 信息 。 首 先 ，SYN 比特 被 置 为 1。 其 次 ,该 TCP 报 文 段 
首部 的 确认 号 字段 被 置 为 client_isn + 1。 最 后 ， 服 务 器 选择 自己 的 初始 序号 
(server_isn) ， 并 将 其 放置 到 TCP 报 文 段 首部 的 序号 字段 中 。 这 个 允许 连接 的 报 文 
段 实际 上 表明 了 :“ 我 收 到 了 你 发 起 建立 连接 的 SYN 分 组 ， 该 分 组 带 有 初始 序号 
client_isn。 我 同意 建立 该 连接 。 我 自己 的 初始 序号 是 server_isn。” 该 允许 连接 的 报 
文 段 被 称 为 SYNACK 报 文 段 (SYNACK segment) 。 

e 第 三 步 : 在 收 到 SYNACK 报 文 段 后 ， 客 户 也 要 给 该 连接 分 配 缓存 和 变量 。 客 户主 
机 则 向 服务 器 发 送 另 外 一 个 报 文 段 ; 这 最 后 一 个 报 文 段 对 服务 器 的 允许 连接 的 报 
文 段 进行 了 确认 (该 客户 通过 将 值 server_isn +1 放置 到 TCP 报 文 段 首部 的 确认 字 
段 中 来 完成 此 项 工作 ) 。 因 为 连接 已 经 建立 了 ， 所 以 该 SYN 比特 被 置 为 0。 该 三 次 
握手 的 第 三 个 阶段 可 以 在 报 文 段 负载 中 携带 客户 到 服务 器 的 数据 。 

一 旦 完成 这 3 个 步 又 ， 客 户 和 服务 器 主机 就 可 以 相互 发 送 包 括 数据 的 报 文 段 了 。 在 
以 后 每 一 个 报 文 段 中 ，SYN 比特 都 将 被 置 为 0。 注 意 到 为 了 创建 该 连接 ， 在 两 台 主 机 之 
间 发 送 了 3 个 分 组 ， 如 图 3-39 所 示 。 由 于 这 个 原因 ， 这 种 连接 创建 过 程 通常 被 称 为 3 
次 握手 (three-way handshake) 。TCP 3 次 握手 的 几 个 方面 将 在 课 后 习题 中 讨论 (为 什么 
需要 初始 序号 ? 为 什么 需要 3 次 握手 ， 而 不 是 两 次 握手 ? ) 。 注 意 到 这 样 一 件 事 是 很 有 趣 

一 个 攀岩 者 和 一 个 保护 者 〈 他 位 于 攀岩 者 的 下 面 ， 他 的 任务 是 处 理 好 攀岩 者 的 安全 
绳索 ) 就 使 用 了 与 TCP 相同 的 3 次 握手 通信 协议 ， 以 确保 在 攀岩 者 开始 攀 疏 前 双方 都 已 
经 准备 好 了 。 
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图 3-39 TCP 三 次 握手 : 报 文 段 交换 
天 下 没有 不 散 的 宴席 ， 对 于 TCP 连接 也 是 如 此 。 参 与 一 条 TCP 连接 的 两 个 进程 中 的 


任何 一 个 都 能 终止 该 连接 。 当 连接 结束 后 ， 
主机 中 的 “资源 ”( 即 缓存 和 变量 ) 将 被 
释放 。 举 一 个 例子 ,假设 某 客户 打算 关闭 
连接 ， 如 图 3-40 所 示 。 客 户 应 用 进程 发 出 
一 个 关闭 连接 命令 。 这 会 引起 客户 TCP 向 
服务 器 进程 发 送 一 个 特殊 的 TCP 报 文 段 。 
这 个 特殊 的 报 文 段 让 其 首部 中 的 一 个 标志 
位 即 FIN 比特 (参见 图 3-29) 被 设置 为 
1。 当 服务 器 接收 到 该 报 文 段 后 ， 就 向 发 送 
方 回 送 一 个 确认 报 文 段 。 然 后 ， 服 务 器 发 
送 它 自己 的 终止 报 文 段 ， 其 FIN 比特 被 置 
为 1。 最 后 ， 该 客户 对 这 个 服务 器 的 终止 
报 文 段 进行 确认 。 此 时 ， 在 两 台 主 机 上 用 
于 该 连接 的 所 有 资源 都 被 释放 了 。 
在 一 个 TCP 连接 的 生命 周期 内 ， 运 行 
在 每 台 主 机 中 的 TCP 协议 在 各 种 TCP 状 
态 (TOP state) 之 间 变 迁 。 图 3-41 说 明了 
客户 TCO 会 经 历 的 一 系列 典型 TCP 状态 。 





客户 
ACK : 
FIN :关闭 
定时 等 竺 : 
已 关闭 : : 
了 v 
时 间 时 间 


图 3-40 关闭 一 条 TCP 连接 


客户 TCP 开始 时 处 于 CLOSED (关闭 ) 状态 。 客 户 的 应 用 程序 发 起 一 个 新 的 TCP 连接 
(可 通过 在 第 2 章 讲 过 的 Python 例子 中 创建 一 个 Socket 对 象 来 完成 ) 。 这 引起 客户 中 的 TCP 
向 服务 器 中 的 TCP 发送 一 个 SYN 报 文 段 。 在 发 送 过 SYN 报 文 段 后 ， 客 户 TCP 进入 了 SYN_ 
SENT 状态 。 当 客户 TCP 处 在 SYN_SENT 状态 时 ， 它 等 待 来 自 服务 器 TCP 的 对 客户 所 发 报 
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文 段 进行 确认 且 SYN 比特 被 置 为 1 的 一 个 报 文 段 。 收 到 这 样 一 个 报 文 段 之 后 ， 客 户 TCP 
进入 ESTABLISHED (已 建立 ) 状态 。 当 处 在 ESTABLISHED 状态 时 ，TCP 客户 就 能 发 送 和 
接收 包含 有 效 载 荷 数据 〈 即 应 用 层 产 生 的 数据 ) 的 TCP 报 文 段 了 。 


客户 应 用 程序 发 起 
一 个 TCP 连 接 
CLOSED | 
eH: Te N 
发 送 SYN 
TIME_WAIT SYN_SENT 
REFIN, 接收 SYN & ACK， 
发 送 ACK 发 送 ACK 
FIN_WAIT_2 ESTABLISHED 
发 送 FIN 
接收 ACK， 
”不 发 送 FIN_WAIT_1 
客户 应 用 程序 
发 起 关闭 连接 


图 3-41 客户 TCP 经 历 的 典型 的 TCP 状态 序列 


假设 客户 应 用 程序 决定 要 关闭 该 连接 。( 注意 到 服务 器 也 能 选择 关闭 该 连接 。) 这 引起 
客户 TCP 发 送 一 个 带 有 TIN 比特 被 置 为 1 的 TCP 报 文 段 ， 并 进入 FIN_WAIT_1 状态 。 当 处 
在 FIN_WAIT_1 状态 时 ， 客 户 TCP 等 待 一 个 来 自 服务 器 的 带 有 确认 的 TCP 报 文 段 。 当 它 收 
到 该 报 文 段 时 ， 客 户 TCP 进入 FIN_WAIT_2 状态 。 当 处 在 FIN_WAIT_2 状态 时 ， 客 户 等 待 
来 自 服务 器 的 FIN 比特 被 置 为 1 的 另 一 个 报 文 段 ; 当 收 到 该 报 文 段 后 ， 客 户 TCP 对 服务 器 
的 报 文 段 进行 确认 ， 并 进入 TIME_WAIT 状态 。 假 定 ACK 丢失 ，TIME_WAIT 状态 使 TCP 
客户 重 传 最 后 的 确认 报 文 。 在 TIME_WAIT 状态 中 所 消耗 的 时 间 是 与 具体 实现 有 关 的 ， 而 
典型 的 值 是 30 秒 、1 分 钟 或 2 分 钟 。 经 过 等 竺 后， 连接 就 正式 关闭 ， 客 户 端 所 有 资源 ( 包 
括 端口 号 ) 将 被 释放 。 





SYN 洪 泛 攻击 | 


我 们 在 TCP 三 次 握手 的 讨论 中 已 经 看 到 ， 服 务 器 为 了 响应 一 个 收 到 的 SYN， 分 配 并 
初始 化 连接 变量 和 缓存 。 然 后 服务 器 发 送 一 个 SYNACK 进行 响应 ， 并 等 待 来 自 客 户 的 
ACK 报 文 段 。 如 果 某 客户 不 发 送 ACK 来 完成 该 三 次 握手 的 第 三 步 ， 最 终 (通常 在 一 分 
多 钟 之 后 ) 服务 器 将 终止 该 半 开 连接 并 回收 资源 。 

这 种 TCP 连接 管理 协议 为 经 典 的 DoS 攻击 即 SYN 洪 泛 攻击 (SYN flood attack) 提 
供 了 环境 。 在 这 种 攻击 中 ， 攻 击 者 发 送 大 量 的 TCP SYN 报 文 段 ， 而 不 完成 第 三 次 握手 
的 步骤 。 随 着 这 种 SYN 报 文 段 纷 至 丕 来 ， 服 务 器 不 断 为 这 些 半 开 连接 分 配 资源 (但 从 未 
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使 用 ) ， 导 致 服务 器 的 连接 资源 被 消耗 苔 尽 。 这 种 SYN 洪 泛 攻击 是 被 记载 的 众多 DoS 牙 | 
击 中 的 第 一 种 [CERT SYN 1996 ] 。 幸 运 的 是 ， 现 在 有 一 种 有 效 的 防御 系统 ， 称 为 SYN 
cookie [RFC 4987]， 它 们 被 部 署 在 大 多 数 主流 操作 系统 中 。SYN cookie 以 下 列 方式 
工作 : 
© 当 服 务 器 接收 到 一 个 SYN 报 文 段 时 ， 它 并 不 知道 该 报 文 段 是 来 自 一 个 合法 的 用 
户 ,还 是 一 个 SYN 洪 泛 攻击 的 一 部 分 。 因 此 服务 器 不 会 为 该 报 文 段 生成 一 个 半 
开 连 接 。 相 反 ， 服 务 器 生成 一 个 初始 TCP 序列 号 ,该 序列 号 是 SYN 报 文 段 的 源 
和 目的 IP 地 址 与 端口 号 以 及 仅 有 该 服务 器 知道 的 秘密 数 的 一 个 复杂 函数 ( 散 列 
函数 ) 。 这 种 精心 制作 的 初始 序列 号 被 称 为 “cookie”。 服 务 器 则 发 送 具 有 这 种 
特殊 初始 序列 号 的 SYNACK 分 组 。 重 要 的 是 ， 服 务 器 并 不 记忆 该 cookie 或 任何 
对 应 于 SYN 的 其 他 状态 信息 。 
e 如 果 客 户 是 合法 的 ， 则 它 将 返回 一 个 ACK 报 文 段 。 当 服务 器 收 到 该 ACK， 需 要 
验证 该 ACK 是 与 前 面 发 送 的 某 些 SYN 相对 应 的 。 如 果 服 务 器 没有 维护 有 关 SYN 
报 文 段 的 记忆 ， 这 是 怎样 完成 的 呢 ? 正如 你 可 能 猜测 的 那样 ， 它 是 借助 于 
cookie 来 做 到 的 。 前 面 讲 过 对 于 一 个 合法 的 ACK， 在 确认 字段 中 的 值 等 于 在 
SYNACK 字段 (此 时 为 cookie 值 ) 中 的 值 加 1 (参见 图 3-39)。 服 务 器 则 将 使 用 
Æ SYNACK 报 文 段 中 的 源 和 目的 地 了 P 地址 与 端口 号 (它们 与 初始 的 SYN 中 的 
相同 ) 以 及 秘密 数 运行 相同 的 散 列 函数 。 如 果 该 函数 的 结果 加 1 与 在 客户 的 
SYNACK 中 的 确认 (cookie) 值 相同 的 话 ， 服 务 器 认为 该 ACK 对 应 于 较 早 的 
SYN 报 文 段 ， 因 此 它 是 合法 的 。 服 务 器 则 生成 一 个 具有 套 接 字 的 全 开 的 连接 。 
© 在 另 一 方面 ， 如 果 客 户 没 有 返回 一 个 ACK 报 文 段 ， 则 初始 的 SYN 并 没有 对 服务 
器 产生 危害 ， 因 为 服务 器 没有 为 它 分 配 任何 资源 。 
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图 3-42 图 示 了 服务 器 端的 TCP 通常 要 经 历 的 一 系列 状态 ， 其 中 假设 客户 开始 连接 拆 
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图 3-42 服务 器 端 TCP 经 历 的 典型 的 TCP 状态 序列 
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除 。 这 些 状态 变迁 是 自 解 释 的 。 在 这 两 个 状态 变迁 图 中 ， 我 们 只 给 出 了 TCP 连接 是 如 何 正 
常 地 被 建立 和 拆除 的 。 我 们 没有 描述 在 某 些 不 正常 的 情况 下 (例如 当 连 接 的 双方 同时 都 要 
发 起 或 终止 一 条 连接 时 ) 发 生 的 事情 。 如 果 你 对 此 问题 及 其 他 与 TCP 有 关 的 高 级 问题 感 
兴趣 ， 推 荐 阅读 Stevens 的 内 容 更 全 面 的 书籍 [Stevens 1994], 
我 们 上 面 的 讨论 假定 了 客户 和 服务 器 都 准备 通信 ， 即 服务 器 正在 监听 客户 发 送 其 SYN 
报 文 段 的 端口 。 我 们 来 考虑 当 一 台 主 机 接收 到 一 个 TCP 报 文 段 ， 其 端口 号 或 源 卫 地 址 与 
该 主机 上 进行 中 的 套 接 字 都 不 匹配 的 情况 。 例 如 ， 假 如 一 台 主 机 接收 了 具有 目的 端口 80 
的 一 个 TCP SYN 分 组 ， 但 该 主机 在 端口 80 不 接受 连接 ( 即 它 不 在 端口 80 上 运行 Web 服 
务 器 ) 。 则 该 主机 将 向 源 发 送 一 个 特殊 重 置 报 文 段 。 该 TOP 报 文 段 将 RST 标志 位 (参见 
3.5.2 节 ) 置 为 1。 因 此 ， 当 主机 发 送 一 个 重 置 报 文 段 时 ， 它 告诉 该 源 “ 我 没有 那个 报 文 
段 的 套 接 字 。 请 不 要 再 发 送 该 报 文 段 了 ”。 当 一 人 台 主 机 接收 一 个 UDP 分 组 ， 它 的 目的 端口 
与 进行 中 的 UDP 套 接 字 不 匹配 ， 该 主机 发 送 一 个 特殊 的 ICMP 数据 报 ， 这 将 在 第 4 章 中 
讨论 。 
既然 我 们 已 经 对 TCP 连接 管理 有 了 深入 的 了 解 ， 我 们 再 次 回顾 nmap 端口 扫描 工具 ， 
并 更 为 详细 地 研究 它 的 工作 原理 。 为 了 探索 目标 主机 上 的 一 个 特定 的 TCP 端口 ， 如 端口 
6789, nmap 将 对 那 台 主机 的 目的 端口 6789 发 送 一 个 特殊 的 TCP SYN 报 文 段 。 有 3 种 可 能 
的 输出 : 
© 源 主 机 从 目标 主机 接收 到 一 个 TCP SYNACK 报 文 段 。 因 为 这 意味 着 在 目标 主机 上 
一 个 应 用 程序 使 用 TCP 端口 6789 运行 ，nmap 返回 “打开 ”。 
© 源 主机 从 目标 主机 接收 到 一 个 TCP RST 报 文 段 。 这 意味 着 该 SYN 报 文 段 到 达 了 目 
标 主机 ， 但 目标 主机 没有 和 运行 一 个 使 用 TCP 端口 6789 的 应 用 程序 。 但 攻击 者 至 少 
知道 发 向 该 主机 端口 6789 的 报 文 段 没 有 被 源 和 目标 主机 之 间 的 任何 防火 墙 所 阻 
挡 。( 将 在 第 8 章 中 讨论 防火 墙 。) 
© 源 什么 也 没有 收 到 。 这 很 可 能 表明 该 SYN 报 文 段 被 中 间 的 防火 墙 所 阻挡 ， 无 法 到 
达 目 标 主机 。 
nmap 是 一 个 功能 强大 的 工具 ， 该 工具 不 仅 能 “侦察 ”打开 的 TCP 端口 ， 也 能 “ 侦 
察 ” 打 开 的 UDP 端口 ， 还 能 “侦察 ”防火 墙 及 其 配置 ， 甚 至 能 “侦察 ”应 用 程序 的 版 本 
和 操作 系统 。 其 中 的 大 多 数 都 能 通过 操作 TCP 连接 管理 报 文 段 完成 [Skoudis 2006 ] 。 读 者 
能 够 从 www. nmap. org 下 载 nmap, 
到 此 ， 我 们 介绍 完了 TCP 中 的 差错 控制 和 流量 控制 。 在 3.7 节 中 ， 我 们 将 回 到 TCP 并 
更 深入 地 研究 TCP 拥塞 控制 问题 。 然 而 ， 在 此 之 前 ， 我 们 先后 退 一 步 ， 在 更 广泛 环境 中 讨 
论 拥塞 控制 问题 。 


3.6 拥塞 控制 原理 


在 前 面 几 节 中 ， 我们 已 经 分 析 了 面临 分 组 丢失 时 用 于 提供 可 靠 数 据 传输 服务 的 基本 原 
理 及 特定 的 TCP 机制。 我 们 以 前 讲 过 ， 在 实践 中 ,这 种 丢 包 一 般 是 当 网 络 变 得 拥塞 时 由 于 
路 由 器 缓存 溢出 引起 的 。 分 组 重 传 因此 作为 网 络 拥塞 的 征兆 〈 某 个 特定 的 运输 层 报 文 段 的 
丢失 ) 来 对 待 ， 但 是 却 无 法 处 理 导致 网 络 拥塞 的 原因 ， 因 为 有 太 多 的 源 想 以 过 高 的 速率 发 
送 数 据 。 为 了 处 理 网 络 拥塞 原因 ， 需 要 一 些 机 制 以 在 面临 网 络 拥塞 时 遏制 发 送 方 。 

在 本 节 中 ， 我们 考虑 一 般 情况 下 的 拥塞 控制 问题 ,试图 理解 为 什么 网 络 拥塞 是 一 件 坏 
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事情 ， 网 络 拥塞 是 如 何在 上 层 应 用 得 到 的 服务 性 能 中 明确 地 显露 出 来 的 ? 如 何 可 用 各 种 方 
法 来 避免 网 络 拥塞 或 对 它 做 出 反应 ? 这 种 对 拥塞 控制 的 更 一 般 研究 是 恰当 的 ， 因 为 就 像 可 
靠 数据 传输 一 样 ， 它 在 组 网 技术 中 的 前 10 个 基础 性 重要 问题 清单 中 位 居 前 列 。 下 面 一 节 
详细 研究 TCP 的 拥塞 控制 算法 。 


3.6.1 拥塞 原因 与 代价 


我 们 通过 分 析 3 个 复杂 性 越 来 越 高 的 发 生 拥塞 的 情况 ， 开 始 对 拥塞 控制 的 一 般 性 研 
究 。 在 每 种 情况 下 ， 我 们 首先 将 看 看 出 现 拥塞 的 原因 以 及 拥塞 的 代价 〈 根 据 资源 未 被 充分 
利用 以 及 端 系统 得 到 的 低劣 服务 性 能 来 评价 ) 。 我 们 暂 不 关注 如 何 对 拥塞 做 出 反应 或 避免 
拥塞 ， 而 是 重点 理解 一 个 较为 简单 的 问题 ， 即 随 着 主机 增加 其 发 送 速率 并 使 网 络 变 得 拥 
塞 ， 这 时 会 发 生 的 情况 。 

1. 情况 1: 两 个 发 送 方 和 一 台 具 有 无 穷 大 缓存 的 路 由 器 


我 们 先 考虑 也 许 是 最 简单 的 拥塞 情况 : 两 台 主 机 (A 和 B) 都 有 一 条 连接 ， 且 这 两 条 
连接 共享 源 与 目的 地 之 间 的 单 跳 路 由 ， 如 图 3-43 所 示 。 





无 限 的 共享 
输出 链 路 缓存 


图 3-43 拥塞 情况 1: 两 条 连接 共享 具有 无 限 大 缓存 的 单 跳 路 由 


我 们 假设 主机 A 中 的 应 用 程序 以 A;, 字 节 / 秒 的 平均 速率 将 数据 发 送 到 连接 中 (例如 ， 
通过 一 个 套 接 字 将 数据 传递 给 运输 层 协 议 )。 这 些 数据 是 初始 数据 ， 这 意味 着 每 个 数据 单 
元 仅 向 套 接 字 中 发 送 一 次 。 下 面 的 运输 层 协 议 是 一 个 简单 的 协议 。 数 据 被 封装 并 发 送 ; 不 
执行 差错 恢复 (如 重 传 )、 流 量 控制 或 拥塞 控制 。 忽 略 由 于 添加 运输 层 和 较 低 层 首 部 信息 
产生 的 额外 开销 ， 在 第 一 种 情况 下 ， 主 机 A 向 路 由 器 提供 流量 的 速率 是 A;, 字 节 / 秒 。 主 机 
B 也 以 同样 的 方式 运行 ,为 了 简化 问题 ,我们 假设 它 也 是 以 速率 A;, 字 节 / 秒 发 送 数 据 。 来 
自主 机 A 和 主机 B 的 分 组 通过 一 台 路 由 器 ， 在 一 段 容量 为 R 的 共享 式 输出 链 路 上 传输 。 
该 路 由 器 带 有 缓存 ， 可 用 于 当 分 组 到 达 速 率 超过 该 输出 链 路 的 容量 时 存储 “入 分 组 ”。 在 
此 第 一 种 情况 下 ， 我 们 将 假设 路 由 器 有 无 限 大 的 缓存 空间 。 

图 3-44 描绘 出 了 第 一 种 情况 下 主机 A 的 连接 性 能 。 左 边 的 图 形 描绘 了 每 连接 的 吞吐 
量 (per-connection throughput) (接收 方 每 秒 接收 的 字 节 数 ) 与 该 连接 发 送 速率 之 间 的 函 
数 关系 。 当 发 送 速率 在 0 ~ R/2 之 间 时 ， 接 收 方 的 吞吐 量 等 于 发 送 方 的 发 送 速率 ， 即 发 送 
方 发 送 的 所 有 数据 经 有 限时 延 后 到 达 接 收 方 。 然 而 当 发 送 速率 超过 R/2 时 ， 它 的 吞吐 量 只 
能 达 RA/2。 这 个 吞吐 量 上 限 是 由 两 条 连接 之 间 共 享 链 路 容量 造成 的 。 链 路 完全 不 能 以 超过 
R/2 的 稳定 状态 速率 向 接收 方 交付 分 组 。 无 论 主机 A 和 主机 B 将 其 发 送 速 率 设置 为 多 高 ， 
它们 都 不 会 看 到 超过 R/2 的 吞吐 量 。 
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a) b) 
图 3-44 拥塞 情况 1: 吞吐 量 、 时 延 与 主机 发 送 速率 的 函数 关系 


取得 每 连接 R/2 的 吞吐 量 实际 上 看 起 来 可 能 是 件 好事 ， 因 为 在 将 分 组 交付 到 目的 地 的 
过 程 中 链 路 被 充分 利用 了 。 但 是 ， 图 3-44b 的 图 形 却 显示 了 以 接近 链 路 容量 的 速率 运行 时 
产生 的 后 果 。 当 发 送 速率 接近 R/2 时 (从 左 至 右 ) ， 平 均 时 延 就 会 越 来 越 大 。 当 发 送 速率 
超过 R/2 时 ， 路 由 器 中 的 平均 排队 分 组 数 就 会 无 限 增长 ， 源 与 目的 地 之 间 的 平均 时 延 也 会 
变 成 无 穷 大 (假设 这 些 连接 以 此 发 送 速 率 运行 无 限 长 时 间 并 且 有 无 限量 的 缓存 可 用 )。 因 
此 ， 虽 然 从 吞吐 量 角度 看 ， 运 行 在 总 吞吐 量 接近 R 的 状态 也 许 是 一 个 理想 状态 ,但 从 时 延 
角度 看 ， 却 远 不 是 一 个 理想 状态 。 其 至 在 这 种 (极端) 理想 化 的 情况 中 ， 我 们 已 经 发 现 了 
拥塞 网 络 的 一 种 代价 ， 即 当 分 组 的 到 达 速 率 接近 链 路 容量 时 ， 分 组 经 历 巨 大 的 排队 时 延 。 
2. 情况 2: 两 个 发 送 方 和 一 台 具 有 有 限 缓存 的 路 由 器 
现在 我 们 从 下 列 两 个 方面 对 情况 1 稍微 做 一 些 修 改 (参见 图 3-45)。 首 先 ， 假定 路 由 
器 缓存 的 容量 是 有 限 的 。 这 种 现实 世界 的 假设 的 结果 是 ， 当 分 组 到 达 一 个 已 满 的 缓存 时 会 
被 丢弃 。 其 次 ,我 们 假定 每 条 连接 都 是 可 靠 的 。 如 果 一 个 包含 有 运输 层 报 文 段 的 分 组 在 路 
由 器 中 被 丢弃 ， 那么 它 终 将 被 发 送 方 重 传 。 由 于 分 组 可 以 被 重 传 ， 所 以 我 们 现在 必须 更 小 
心地 使 用 发 送 速 率 这 个 术语 。 特 别 是 我 们 再 次 以 A;, 字 节 / 秒 表示 应 用 程序 将 初始 数据 发 送 
到 套 接 字 中 的 速率 。 运 输 层 向 网 络 中 发 送 报 文 段 (含有 初始 数据 或 重 传 数据 ) 的 速率 用 
和 字 节 /秒表 示 。A!, 有 时 被 称 为 网 络 的 供给 载荷 (offered load) 。 
An: 初始 数据 
Al: 初始 数据 加 重 传 数据 





有 限 的 共享 
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图 3-45 ”情况 2: (有 重 传 的 ) 两 台 主 机 与 一 台 拥 有 有 限 缓存 的 路 由 器 
在 情况 2 下 实现 的 性 能 强烈 地 依赖 于 重 传 的 方式 。 首 先 ， 考 虑 一 种 不 真实 的 情况 ， 即 





主机 A 能 够 以 某 种 方式 (不 可 思议 地 !) 确定 路 由 器 中 的 缓存 是 否 空 亲 ， 因 而 仅 当 缓存 空 
闲 时 才 发 送 一 个 分 组 。 在 这 种 情况 下 ， 将 不 会 产生 丢 包 ，Ai 与 儿 相 等 ， 并 且 连 接 的 吞吐 
量 就 等 于 Aiu。 图 3-46a 中 描述 了 这 种 情况 。 从 吞吐 量 的 角度 看 ， 性 能 是 理想 的 ， 即 发 送 的 
每 个 分 组 都 被 接收 到 。 注 意 到 在 这 种 情况 下 ,平均 主机 发 送 速率 不 能 超过 RA2， 因 为 假定 
不 会 发 生 分 组 丢失 。 

接 下 来 考虑 一 种 更 为 真实 的 情况 ， 发 送 方 仅 当 在 确定 了 一 个 分 组 已 经 丢失 时 才 重 传 。 
(同样 ， 所 做 的 假设 有 一 些 弹 性 。 然 而 ， 发 送 主 机 有 可 能 将 超时 时 间 设 置 得 足够 长 ， 以 无 
形 中 使 其 确信 一 个 还 没有 被 确认 的 分 组 已 经 丢失 。) 在 这 种 情况 下 ， 性 能 就 可 能 与 图 3-46b 
所 示 的 情况 相似 。 为 了 理解 这 时 发 生 的 情况 ， 考 虑 一 下 供给 载荷 和 A';， (初始 数据 传输 加 上 
重 传 的 总 速率 ) 等 于 R/2 的 情况 。 根 据 图 3-46b， 在 这 一 供给 载荷 值 时 ， 数 据 被 交付 给 接 
收 方 应 用 程序 的 速率 是 RA3。 因 此 ， 在 所 发 送 的 0.5R 单位 数据 当中 ， 从 平均 的 角度 说 ， 
0. 333R 字 节 / 秒 是 初始 数据 ， 而 0. 166R 字 节 / 秒 是 重 传 数据 。 我 们 在 此 看 到 了 另 一 种 网 络 
拥塞 的 代价 ， 即 发 送 方 必 须 执行 重 传 以 补偿 因为 缓存 溢出 而 丢弃 (丢失 ) 的 分 组 。 

最 后 ， 我 们 考虑 下 面 一 种 情况 : 发 送 方 也 许 会 提前 发 生 超时 并 重 传 在 队列 中 已 被 推迟 
但 还 未 丢失 的 分 组 。 在 这 种 情况 下 ,初始 数据 分 组 和 重 传 分 组 都 可 能 到 达 接 收 方 。 当 然 ， 
接收 方 只 需要 一 份 这 样 的 分 组 副本 就 行 了 ， 重 传 分 组 将 被 丢弃 。 在 这 种 情况 下 ， 路 由 器 转 
发 重 传 的 初始 分 组 副本 是 在 做 无 用 功 ， 因 为 接收 方 已 收 到 了 该 分 组 的 初始 版 本 。 而 路 由 器 
本 可 以 利用 链 路 的 传输 能 力 去 发 送 另 一 个 分 组 。 这 里 ， 我 们 又 看 到 了 网 络 拥塞 的 另 一 种 代 
价 ， 即 发 送 方 在 遇 到 大 时 延 时 所 进行 的 不 必要 重 传 会 引起 路 由 器 利用 其 链 路 带宽 来 转发 不 
必要 的 分 组 副本 。 图 3-46c 显示 了 当 假 定 每 个 分 组 被 路 由 器 转发 (F) AK, FE 
与 供给 载荷 的 对 比 情况 。 由 于 每 个 分 组 被 转发 两 次 ， 当 其 供给 载荷 接近 R/2 时 ， 其 吞吐 量 
将 渐 近 R/4。 


R/2 


= R/4 





R/2 





fa hin 
a) b) 
图 3-46 具有 有 限 缓存 时 情况 2 的 性 能 


3. 情况 3: 4 个 发 送 方 和 具有 有 限 缓存 的 多 台 路 由 器 及 多 跳 路 径 

在 最 后 一 种 拥塞 情况 中 ， 有 4 台 主 机 发 送 分 组 ， 每 台 都 通过 交友 的 两 跳 路 径 传输 ， 如 
图 3-47 所 示 。 我 们 再 次 假设 每 台 主 机 都 采用 超时 / 重 传 机 制 来 实现 可 靠 数据 传 输 服务 ， 所 
有 的 主机 都 有 相同 的 A;, 值 ， 所 有 路 由 器 的 链 路 容量 都 是 尺 字 节 / 秒 。 

我 们 考虑 从 主机 A 到 主机 C 的 连接 ， 该 连接 经 过 路 由 器 RI 和 R2。A -C 连接 与 D - 
B 连接 共享 路 由 器 R1， 并 与 B -D 连接 共享 路 由 器 R2。 对 极 小 的 Ai;, 值 ， 路 由 器 缓存 的 洲 
出 是 很 少见 的 (与 拥塞 情况 1、 拥 塞 情况 2 中 的 一 样 )， 吞吐 量 大 致 接近 供给 载荷 。 对 稍 
大 的 Ai 值 ， 对 应 的 吞吐 量 也 更 大 ， 因 为 有 更 多 的 初始 数据 被 发 送 到 网 络 中 并 交付 到 目的 
地 ， 滋 出 仍然 很 少 。 因 此 ， 对 于 较 小 的 和;,，A;; 的 增 大 会 导致 A,, 的 增 大 。 
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Ain? 初始 数据 
‘a? 初始 数据 加 重 传 数据 一 ?ou 








图 3-47 ”四 个 发 送 方 和 具有 有 限 缓存 的 多 台 路 由 器 及 多 跳 路 径 


在 考虑 了 流量 很 小 的 情况 后 ， 下 面 分 析 当 Ai 《因此 An) 很 大 时 的 情况 。 考 虑 路 由 器 
R2。 不 管 A;, 的 值 是 多 大 ， 到 达 路 由 器 R2 的 A -C 流量 (在 经 过 路 由 器 RI 转发 后 到 达 路 
由 器 R2) 的 到 达 速 率 至 多 是 R， 也 就 是 从 RI 到 R2 的 链 路 容量 。 如 果 和 A; 对 于 所 有 连接 
(包括 B -D 连接 ) 来 说 是 极 大 的 值 ， 那 么 在 R2 上 ，B -D 流量 的 到 达 速 率 可 能 会 比 A-C 
流量 的 到 达 速 率 大 得 多 。 因 为 A -C 流量 与 B -D 流量 在 路 由 器 R2 上 必须 为 有 限 缓存 空间 


而 竞争 ， 所 以 当 来 自 B -DD 连接 的 供给 载荷 越 来 
越 大 时 ，A -C 连接 上 成 功 通过 R2 ( 即 由 于 缓存 
溢出 而 未 被 丢失 ) 的 流量 会 越 来 越 小 。 在 极限 情 
况 下 ， 当 供给 载荷 趋 近 于 无 穷 大 时 ，R2 的 空闲 
缓存 会 立即 被 B -D 连接 的 分 组 占 满 ， 因 而 A - C 
ERE R 上 的 吞吐 量 趋 近 于 0。 这 又 一 次 说 明 
在 重 载 的 极限 情况 下 ，A - C 端 到 端 吞吐 量 将 趋 
近 于 0。 这 些 考虑 引发 了 供给 载荷 与 吞吐 量 之 间 
的 权衡 ， 如 图 3-48 所 示 。 

当 考 虑 由 网 络 所 做 的 浪费 掉 的 工作 量 时 ， 
随 着 供给 载荷 的 增加 而 使 符 吐 量 最 终 减 少 的 原 
因 是 明显 的 。 在 上 面 提 到 的 大 流量 的 情况 中 ， 


R/2 


At 


图 3-48 具有 有 限 缓存 和 多 跳 
路 径 时 的 情况 3 性 能 


每 当 有 一 个 分 组 在 第 二 跳 路 由 器 上 被 丢弃 时 ， 第 一 跳 路 由 器 所 做 的 将 分 组 转发 到 第 二 
跳 路 由 器 的 工作 就 是 “ 劳 而 无 功 ” 的 。 如 果 第 一 跳 路 由 器 只 是 丢弃 该 分 组 并 保持 空 
闲 ， 则 网 络 中 的 情况 是 幸运 的 (更 准确 地 说 是 糟糕 的 ) 。 需 要 指出 的 是 ， 第 一 跳 路 由 
器 所 使 用 的 将 分 组 转发 到 第 二 跳 路 由 器 的 传输 容量 用 来 传送 不 同 的 分 组 可 能 更 有 效 
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益 。( 例 如 ， 当 选择 一 个 分 组 发 送 时 ， 路 由 器 最 好 优先 考虑 那些 已 经 历 过 一 定数 量 的 
上 游 路 由 器 的 分 组 。) 所 以 ， 我 们 在 此 又 看 到 了 由 于 拥塞 而 丢弃 分 组 的 另 一 种 代价 ， 
即 当 一 个 分 组 沿 一 条 路 径 被 丢弃 时 ， 每 个 上 游 路 由 器 用 于 转发 该 分 组 到 丢弃 该 分 组 而 
使 用 的 传输 容量 最 终 被 浪费 挤 了 。 


3.6.2 拥塞 控制 方法 


在 3.7 节 中 ， 我 们 将 详细 研究 TCP 用 于 拥塞 控制 的 特定 方法 。 这 里 ， 我 们 指出 在 实践 
中 所 采用 的 两 种 主要 拥塞 控制 方法 ， 讨 论 特 定 的 网 络 体系 结构 和 具体 使 用 这 些 方法 的 拥塞 
控制 协议 。 
在 最 为 宽泛 的 级 别 上 ， 我 们 可 根据 网 络 层 是 否 为 运输 层 拥塞 控制 提供 了 显 式 帮 助 ， 来 
区 分 拥塞 控制 方法 。 
© 端 到 端 拥塞 控制 。 在 端 到 端 拥 塞 控制 方法 中 ， 网 络 层 没有 为 运输 层 拥 塞 控制 提供 
显 式 支持 。 即 使 网 络 中 存在 拥塞 ， 端 系统 也 必须 通过 对 网 络 行 为 的 观察 ( 如 分 组 
丢失 与 时 延 ) 来 推断 之 。 我 们 将 在 3.7.1 节 中 将 看 到 ，TCP 采用 端 到 端的 方法 解 
决 拥塞 控制 ， 因 为 IP 层 不 会 向 端 系统 提供 有 关 网 络 拥塞 的 反馈 信息 。TCP 报 文 段 
的 丢失 (通过 超时 或 3 次 元 余 确认 而 得 知 ) 被 认为 是 网 络 拥塞 的 一 个 迹象 ，TCP 
会 相应 地 减 小 其 窗口 长 度 。 我 们 还 将 看 到 关于 TCP 拥塞 控制 的 一 些 最 新 建议 ， 即 
使 用 增加 的 往返 时 延 值 作为 网 络 拥塞 程度 增加 的 指示 。 
e 网 络 辅助 的 拥塞 控制 。 在 网 络 辅助 的 拥塞 控制 中 ， 路 由 器 向 发 送 方 提供 关于 网 络 
中 拥塞 状态 的 显 式 反馈 信息 。 这 种 反馈 可 以 简单 地 用 一 个 比特 来 指示 链 路 中 的 拥 
塞 情 况 。 该 方法 在 早期 的 IBM SNA [Schwartz 1982], DEC DECnet [Jain 1989; 
Ramakrishnan 1990] 和 ATM [Black 1995] 等 体系 结构 中 被 采用 。 更 复杂 的 网 络 
反馈 也 是 可 能 的 。 例 如 ,在 ATM 可 用 比特 率 (Available Bite Rate, ABR) 拥塞 控 
制 中 ， 路 由 器 显 式 地 通知 发 送 方 它 〈 路 由 器 ) 能 在 输出 链 路 上 支持 的 最 大 主机 发 
送 速率 。 如 上 面 所 提 到 的 ， 默 认 因 特 网 版 本 的 了 和 TCP 采用 端 到 端 拥 塞 控制 方 
法 。 然 而 ， 我 们 在 3. 7. 2 节 中 将 看 到 ， 最 近 IP 和 TCP 也 能 够 选择 性 地 实现 网 络 辅 


助 拥塞 控制 。 
对 于 网 络 辅助 的 拥塞 控制 ， 拥 塞 信息 从 网 络 反馈 到 发 送 方 通常 有 两 种 方式 ， 如 图 3-49 
主机 A 主机 B 


经 由 接收 方 的 网 络 反馈 






aaan 
MN enan 


N 


2 多 


图 3-49 网络 指示 拥塞 信息 的 两 种 反馈 路 径 
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所 示 。 直 接 反馈 信息 可 以 由 网 络 路 由 器 发 给 发 送 方 。 这 种 方式 的 通知 通常 采用 了 一 种 阻塞 
分 组 (choke packet) 的 形式 〈 主 要 是 说 :“ 我 拥塞 了 !”) 。 更 为 通用 的 第 二 种 形式 的 通知 
是 ， 路 由 器 标记 或 更 新 从 发 送 方 流向 接收 方 的 分 组 中 的 某 个 字段 来 指示 拥塞 的 产生 。 一 旦 
收 到 一 个 标记 的 分 组 后 ， 接 收 方 就 会 向 发 送 方 通知 该 网 络 拥塞 指示 。 注 意 到 后 一 种 形式 的 
通知 至 少 要 经 过 一 个 完整 的 往返 时 间 。 


3.7 TCP 拥塞 控制 


在 本 节 中 ， 我 们 再 次 来 学 习 TCP。 如 我 们 在 3. 5 节 所 见 ，TCP 为 运行 在 不 同 主机 上 的 
两 个 进程 之 间 提 供 了 可 靠 传输 服务 。TCP 的 另 一 个 关键 部 分 就 是 其 拥塞 控制 机 制 。 如 在 前 
一 节 所 指出 ，TCP 必须 使 用 端 到 端 拥塞 控制 而 不 是 使 网 络 辅助 的 拥塞 控制 ， 因 为 P 层 不 
向 端 系统 提供 显 式 的 网 络 拥塞 反馈 。 

TCP 所 采用 的 方法 是 让 每 一 个 发 送 方 根据 所 感知 到 的 网 络 拥塞 程度 来 限制 其 能 向 
连接 发 送 流量 的 速率 。 如 果 一 个 TCP 发 送 方 感知 从 它 到 目的 地 之 间 的 路 径 上 没什么 拥 
塞 ， 则 TCP 发 送 方 增加 其 发 送 速 率 ; 如 果 发 送 方 感知 沿 着 该 路 径 有 拥塞 ， 则 发 送 方 就 
会 降低 其 发 送 速率 。 但 是 这 种 方法 提出 了 三 个 问题 。 第 一 ,一 个 TCP 发 送 方 如 何 限制 
它 向 其 连接 发 送 流量 的 速率 呢 ? 第 二 ,一 个 TCP 发 送 方 如 何 感知 从 它 到 目的 地 之 间 的 
路 径 上 存在 拥塞 呢 ? 第 三 ， 当 发 送 方 感知 到 端 到 端的 拥塞 时 ， 采 用 何 种 算法 来 改变 其 
发 送 速率 呢 ? 

我 们 首先 分 析 一 下 TCP 发 送 方 是 如 何 限制 向 其 连接 发 送 流量 的 。 在 3. 5 节 中 我 们 看 
到 ，TCP 连接 的 每 一 端 都 是 由 一 个 接收 缓存 、 一 个 发 送 缓存 和 几 个 变量 (LastByteRead、 
rwnd 等 ) 组 成 。 运 行 在 发 送 方 的 TCP 拥塞 控制 机 制 跟踪 一 个 额外 的 变量 ， 即 拥塞 窗口 
(congestion window) 。 拥 塞 窗口 表示 为 cwnd， 它 对 一 个 TCP 发 送 方 能 向 网 络 中 发 送 流量 的 
速率 进行 了 限制 。 特 别 是 ， 在 一 个 发 送 方 中 未 被 确认 的 数据 量 不 会 超过 cwnd 与 rwnd 中 的 
最 小 值 ， 即 

LastByteSent - LastByteAcked<min |cwnd，rwnd | 

为 了 关注 拥塞 控制 (与 流量 控制 形成 对 比 ) ， 我 们 后 面 假设 TCP 接收 缓存 足够 大 ， 以 
至 可 以 忽略 接收 窗口 的 限制 ; 因此 在 发 送 方 中 未 被 确认 的 数据 量 仅 受 限于 cwnd。 我 们 还 
假设 发 送 方 总 是 有 数据 要 发 送 ， 即 在 拥塞 窗口 中 的 所 有 报 文 段 要 被 发 送 。 

上 面 的 约束 限制 了 发 送 方 中 未 被 确认 的 数据 量 ， 因 此 间接 地 限制 了 发 送 方 的 发 送 速 
率 。 为 了 理解 这 一 点 ,我 们 来 考虑 一 个 丢 包 和 发 送 时 延 均 可 以 忽略 不 计 的 连接 。 因 此 粗略 
地 讲 ， 在 每 个 往返 时 间 (RTT) 的 起 始点 ， 上 面 的 限制 条 件 允 许 发 送 方向 该 连接 发 送 cwnd 
个 字 节 的 数据 ， 在 该 RTT 结束 时 发 送 方 接收 对 数据 的 确认 报 文 。 因 此 ， 该 发 送 方 的 发 送 速 
率 大 概 是 cwnd/RTT 字 节 / 秒 。 通 过 调节 cwnd 的 值 ， 发 送 方 因 此 能 调整 它 向 连接 发 送 数 据 
的 速率 。 

我 们 接 下 来 考虑 TCP 发 送 方 是 如 何 感知 在 它 与 目的 地 之 间 的 路 径 上 出 现 了 拥塞 的 。 我 
们 将 一 个 TCP RKTT HY “EASE” EMH: 要 么 出 现 超时 ， 要 么 收 到 来 自 接收 方 的 3 
MIER ACK, (回想 我 们 在 3. 5. 4 节 有 关 图 3-33 中 的 超时 事件 的 讨论 和 收 到 3 个 元 余 ACK 
后 包括 快速 重 传 的 后 继 修改 。) 当 出 现 过 度 的 拥塞 时 ， 在 沿 着 这 条 路 径 上 的 一 台 (或 多 
台 ) 路 由 器 的 缓存 会 溢出 ， 引 起 一 个 数据 报 (包含 一 个 TCP 报 文 段 ) HER, EANA 
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据 报 接着 会 引起 发 送 方 的 丢 包 事件 (要 么 超时 或 收 到 3 个 宛 余 ACK) ， 发 送 方 就 认为 在 发 
送 方 到 接收 方 的 路 径 上 出 现 了 拥塞 的 指示 。 
考虑 了 拥塞 检测 问题 后 ， 我 们 接 下 来 考虑 网 络 没有 拥塞 这 种 更 为 乐观 的 情况 ， 即 没有 
出 现 丢 包 事件 的 情况 。 在 此 情况 下 ,在 TCP 的 发 送 方 将 收 到 对 于 以 前 未 确认 报 文 段 的 确 
认 。 如 我 们 将 看 到 的 那样 ，TCP 将 这 些 确认 的 到 达 作 为 一 切 正常 的 指示 ， 即 在 网 络 上 传输 
的 报 文 段 正 被 成 功 地 交付 给 目的 地 ， 并 使 用 确认 来 增加 窗口 的 长 度 (及 其 传输 速率 )。 注 
意 到 如 果 确 认 以 相当 慢 的 速率 到 达 ( 例 如， 如 果 该 端 到 端 路 径 具 有 高 时 延 或 包含 一 段 低 带 
宽 链 路 ) ， 则 该 拥塞 窗口 将 以 相当 慢 的 速率 增加 。 在 另 一 方面 ， 如 果 确 认 以 高 速率 到 达 ， 
则 该 拥塞 窗口 将 会 更 为 迅速 地 增 大 。 因 为 TCP 使 用 确认 来 触发 (或 计时 ) 增 大 它 的 拥塞 
窗口 长 度 ，TCP 被 说 成 是 自 计 时 (self-clocking) 的 。 
给 定 调节 cwnd 值 以 控制 发 送 速率 的 机 制 ， 关 键 的 问题 依然 存在 : TCP 发 送 方 怎样 确 
定 它 应 当 发 送 的 速率 呢 ? 如 果 众 多 TCP 发 送 方 总 体 上 发 送 太 快 ， 它 们 能 够 拥塞 网 络 ， 导 致 
我 们 在 图 3-48 中 看 到 的 拥塞 月 溃 。 事 实 上 ， 为 了 应 对 在 较 早 TCP 版 本 下 观察 到 的 因特网 
PASE AML [Jacobson 1988 ] ， 研 发 了 该 版 本 的 TCP (我 们 马上 将 学 习 它 ) 。 然 而 ， 如 果 TCP 
发 送 方 过 于 谨慎 ， 发 送 太 慢 ， 它们 不 能 充分 利用 网 络 的 带宽 ; 这 就 是 说 ，TCP 发 送 方 能 够 
以 更 高 的 速率 发 送 而 不 会 使 网 络 拥塞 。 那么 TCP 发 送 方 如 何 确定 它们 的 发 送 速 率 ， 既 使 得 
网 络 不 会 拥塞 ， 与 此 同时 又 能 充分 利用 所 有 可 用 的 带宽 ? TC 发 送 方 是 显 式 地 协作 ， 或 存 
在 一 种 分 布 式 方法 使 TCP 发 送 方 能 够 仅 基于 本 地 信息 设置 它们 的 发 送 速率 ? TCP 使 用 下 列 
指导 性 原则 回答 这 些 问题 : 
© 一 个 丢失 的 报 文 段 表 意味 着 拥塞 ， 因 此 当 丢 失 报 文 段 时 应 当 降 低 TCP 发 送 方 的 
速率 。 回 想 在 3. 5.4 节 中 的 讨论 ， 对 于 给 定 报 文 段 ， 一 个 超时 事件 或 四 个 确认 
(一 个 初始 ACK 和 其 后 的 三 个 元 余 ACK) 被 解释 为 跟随 该 四 个 ACK 的 报 文 段 的 
“ 丢 包 事件 ”的 一 种 隐 含 的 指示 。 从 拥塞 控制 的 观点 看 ,该 问题 是 TCP 发 送 方 
应 当 如 何 减 小 它 的 拥塞 窗口 长 度 ， 即 减 小 其 发 送 速率 ， 以 应 对 这 种 推测 的 丢 包 
事件 。 
© 一 个 确认 报 文 段 指示 该 网 络 正 在 向 接收 方 交付 发 送 方 的 报 文 段 ， 因 此 ， 当 对 先前 
未 确认 报 文 段 的 确认 到 达 时 ， 能 够 增加 发 送 方 的 速率 。 确 认 的 到 达 被 认为 是 一 切 
顺利 的 隐 含 指示 ， 即 报 文 段 正 从 发 送 方 成 功 地 交付 给 接收 方 ， 因 此 该 网 络 不 拥塞 。 
拥塞 窗口 长 度 因此 能 够 增加 。 
e 带宽 探测 。 给 定 ACK 指示 源 到 目的 地 路 径 无 拥塞 ， 而 丢 包 事 件 指示 路 径 拥 
Æ, TCP 调节 其 传输 速率 的 策略 是 增加 其 速率 以 响应 到 达 的 ACK， 除 非 出 现 
丢 包 事件 ， 此 时 才 减 小 传输 速率 。 因 此 ， 为 探测 拥塞 开始 出 现 的 速率 ，TCP 
发 送 方 增加 它 的 传输 速率 ， 从 该 速率 后 退 ， 进 而 再 次 开始 探测 ， 看 看 拥塞 开 
始 速率 是 否 发 生 了 变化 。TCP 发 送 方 的 行为 也 许 类 似 于 要 求 (并 得 到 ) 越 来 
越 多 糖果 的 孩子 ， 直 到 最 后 告知 他 /她 “不 行 !”， 孩 子 后 退 一 点 ， 然 后 过 一 会 
儿 再 次 开始 提出 请 求 。 注 意 到 网 络 中 没有 明确 的 拥塞 状态 信 令 ， 即 ACK ME 
包 事 件 充当 了 隐 式 信号 ， 并 且 每 个 TCP 发 送 方 根据 异步 于 其 他 TCP 发 送 方 的 
本 地 信息 而 行动 。 
概述 了 TCP 拥塞 控制 后 ， 现 在 是 我 们 考虑 广 受 鞠 誉 的 TCP 拥塞 控制 算法 (TCP 
congestion control algorithm) 细节 的 时 候 了 ， 该 算法 首先 在 [Jacobson 1988] 中 描述 并 
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Ate [RFC 5681] 中 标准 化 。 该 算法 包括 3 个 主要 部 分 : 中 慢 启 动 ; 加 拥塞 避免 ; 
@ 快 速 恢复 。 慢 启动 和 拥塞 避免 是 TCP 的 强制 部 分 ， 两 者 的 差异 在 于 对 收 到 的 ACK 
做 出 反应 时 增加 cwnd 长 度 的 方式 。 我 们 很 快 将 会 看 到 慢 启动 比 拥塞 避免 能 更 快 地 增 
加 cewnd 的 长 度 〈 不 要 被 名 称 所 迷惑 !) 。 快 速 恢复 是 推荐 部 分 ， 对 TCP 发 送 方 并 非 是 


1. 慢 局 动 


当 一 条 TCP 连接 开始 时 ，cewnd 的 值 通 常 初始 置 为 一 个 MSS 的 较 小 值 LRFC 3390], 
这 就 使 得 初始 发 送 速 率 大 约 为 MSS/RTT。 例 如 ， 如 果 MSS =500 Fi H. RTT =200ms， 则 
得 到 的 初始 发 送 速率 大 约 只 有 20kbps。 由 于 对 TCP 发 送 方 而 言 ， 可 用 带宽 可 能 比 MSS/ 
RIT KZ, TCP 发 送 方 希望 迅速 找到 可 用 主机 B 
带宽 的 数量 。 因 此 ， 在 慢 启 动 (slow- start) 
状态 ，cwnd 的 值 以 1 个 MSS 开始 并 且 每 当 
传输 的 报 文 段 首 次 被 确认 就 增加 1 个 MSS。 
在 图 3-50 所 示 的 例子 中 ，TCP 向 网 络 发 送 
第 一 个 报 文 段 并 等 待 一 个 确认 。 当 该 确认 到 
达 时 ，TCP 发 送 方 将 拥塞 窗口 增加 一 个 
MSS， 并 发 送出 两 个 最 大 长 度 的 报 文 段 。 这 
两 个 报 文 段 被 确认 ， 则 发 送 方 对 每 个 确认 报 
文 段 将 拥塞 窗口 增加 一 个 MSS， 使 得 拥塞 窗 
口 变 为 4 个 MSS， 并 这 样 下 去 。 这 一 过 程 每 
过 一 个 RIT， 发 送 速率 就 翻番 。 因 此 ，TCP 
发 送 速率 起 始 慢 ， 但 在 慢 启 动 阶段 以 指数 
增长 。 

但 是 ， 何 时 结束 这 种 指数 增长 呢 ? 慢 
启动 对 这 个 问题 提供 了 几 种 答案 。 首 先 ， 
如 果 存 在 一 个 由 超时 指示 的 丢 包 事件 ( 即 
HAZE) TCP 发 送 方 将 cwnd 设置 为 1 并 重 
新 开始 慢 启动 过 程 。 它 还 将 第 二 个 状态 变 aatia 
量 的 值 ssthresh (“ 慢 启动 阔 值 ”的 速记 ) À 
设置 为 cewnd/2 ， 即 当 检测 到 拥塞 时 将 ssthresh 置 为 拥塞 窗口 值 的 一 半 。 慢 启动 结束 的 
第 二 种 方式 是 直接 与 ssthresh 的 值 相关 联 。 因 为 当 检 测 到 拥塞 时 ssthresh 设 为 cewnd 的 值 
一 半 ， 当 到 达 或 超过 ssthresh 的 值 时 ， 继 续 使 ewnd 翻番 可 能 有 些 鲁莽 。 因 此 ， 当 cwnd 
的 值 等 于 ssthresh 时 ， 结 束 慢 启 动 并 且 TCP 转移 到 拥塞 避免 模式 。 我 们 将 会 看 到 ， 当 
进入 拥塞 避免 模式 时 ，TCP 更 为 谨慎 地 增加 cwnd。 最 后 一 种 结束 慢 启 动 的 方式 是 ， 
如 果 检 测 到 3 个 元 余 ACK， 这 时 TCP 执行 一 种 快速 重 传 (参见 3.5.4 7) 并 进入 快 
速 恢复 状态 ， 后面 将 讨论 相关 内 容 。 慢 启动 中 的 TCP 行为 总 结 在 图 3-51 中 的 TCP 拥 
塞 控 制 的 FSM 描述 中 。 慢 启动 算法 最 早 源 于 [Jacobson 1988]; 在 [Jain 1986] 中 独 
立地 提出 了 一 种 类 似 于 慢 启 动 的 方法 。 
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图 3-51 TCP 拥塞 控制 的 FSM 描述 





TCP HB: 优化 云 服务 的 性 能 


对 于 诸如 搜索 、 电 子 邮 件 和 社交 网 络 等 云 服 务 ， 非 常 希望 提供 高 水 平 的 响应 性 ， 给 
用 户 一 种 完美 的 印象 ， 即 这 些 服务 正 运行 在 它们 自己 的 端 系统 (包括 其 智能 手机 ) Po 
因为 用 户 经 常 位 于 远离 数据 中 心 的 地 方 ， 而 这 些 数据 中 心 负责 为 云 服务 关联 的 动态 内 容 
提供 服务 。 实 际 上 ， 如 果 端 系统 远离 数据 中 心 ， 则 RTT 将 会 很 大 , 会 由 于 TCP 慢 启 动 
潜在 地 导致 低劣 的 响应 时 间 性 能 。 

作为 一 个 学 习 案 例 ， 考 虑 接收 对 某 搜索 问题 的 响应 中 的 时 延 。 通 常 ， 服 务 器 在 慢 启 
动 期 间 交 付 响应 要 求 三 个 TCP 窗口 [Pathak 2010]。 所 以 从 某 端 系统 发 起 一 条 TCP 连接 
到 它 收 到 该 响应 的 最 后 一 个 分 组 的 时 间 粗 略 是 4* RTT (用 于 建立 TCP 连接 的 一 个 RIT 
加 上 用 于 3 个 数据 窗口 的 3 个 RTT)， 再 加 上 在 数据 中 心中 处 理 的 时 间 。 对 于 一 个 相当 
小 的 查询 来 说 ， 这 些 RTT 时 延 导 致 其 返回 搜索 结果 中 显而易见 的 时 延 。 此 外 ， 在 接 入 网 
| 中 可 能 有 较 大 的 丢 包 ， 导 致 TCP 重 传 甚至 较 大 的 时 延 。 
缓解 这 个 问题 和 改善 用 户 感受 到 的 性 能 的 一 个 途径 是 : 部 署 邻近 用 户 的 前 端 服 务 
| Š; @) 在 该 前 端 服务 器 利用 TCP h (TOP splitting) RA TCP 连接 。 借 助 于 TCP 分 
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岔 ， 客 户 向 邻近 前 端 连接 一 条 TCP 连接， 并且 该 前 端 以 非常 大 的 窗口 向 数据 中 心 维护 一 | 
条 TCP 连接 [Tariq 2008, Pathak 2010, Chen 2011] 。 使 用 这 种 方法 ， 响 应 时 间 大 致 变 | 
为 4* RTTre + RTTes + 处 理 时 间 ， 其 中 RTTre 是 客户 与 前 端 服务 器 之 间 的 往返 时 间 ，| 
RTTse 是 前 端 服 务 器 与 数据 中 心 (后 端 服务 器 ) 之 间 的 往返 时 间 。 如 果 前 端 服务 器 邻近 | 
客户 ， 则 该 响应 时 间 大 约 变 为 RTTss 加 上 处 理 时 间 ， 因 为 RTTrs 小 得 微不足道 并 且 RTTes | 
约 为 RTT。 总 而 言 之 ，TCP 分 贫 大 约 能 够 将 网 络 时 延 从 4* RIT 减少 到 RTT, kir 
善 用 户 感受 的 性 能 ， 对 于 远离 最 近 数 据 中 心 的 用 户 更 是 如 此 。TCP 分 岔 也 有 助 于 减少 因 | 
接 入 网 丢 包 引起 的 TCP 重 传 时 延 。 今 天 ，Google 和 Akamai 在 接 入 网 中 广泛 利用 了 它们 | 
的 CDN 服务 器 ( 回想 2.6 节 中 的 讨论 ) ， 为 它们 支持 的 云 服 务 来 执行 TCP FB [Chen | 
2011]. 





2. 拥塞 避免 

一 旦 进入 拥塞 避免 状态 ，cwnd 的 值 大 约 是 上 次 遇 到 拥塞 时 的 值 的 一 半 ， 即 距离 拥塞 
可 能 并 不 遥远 ! 因此 ，TCP 无 法 每 过 一 个 RIT 再 将 cwd 的 值 翻番 ， 而 是 采用 了 一 种 较为 
保守 的 方法 ， 每 个 RIT 只 将 cwnd 的 值 增 加 一 个 MSS [RFC 5681 ] 。 这 能 够 以 几 种 方式 完 
成 。 一 种 通用 的 方法 是 对 于 TCP 发 送 方 无 论 何 时 到 达 一 个 新 的 确认 ， 就 将 cwnd 增加 一 个 
MSS (MSS/ewnd) 字 节 。 人 例如， 如果 MSS 是 1460 字 节 并 且 cwnd 是 14 600 字 节 ， 则 在 一 
个 RTT 内 发 送 10 个 报 文 段 。 每 个 到 达 ACK (假定 每 个 报 文 段 一 个 ACK) 增加 1/10MSS 
的 拥塞 窗口 长 度 ， 因 此 在 收 到 对 所 有 10 个 报 文 段 的 确认 后 ， 拥 塞 窗口 的 值 将 增加 了 一 
个 MSS。 

但 是 何 时 应 当 结束 拥塞 避免 的 线性 增长 〈 每 RIT IMSS) 呢 ? 当 出 现 超时 时 ，TCP 的 
拥塞 避免 算法 行为 相同 。 与 慢 启动 的 情况 一 样 cwd 的 值 被 设置 为 1 个 MSS， 当 丢 包 事件 
出 现时 ，ssthresh 的 值 被 更 新 为 cwnd 值 的 一 半 。 然 而 ， 前 面 讲 过 丢 包 事件 也 能 由 一 个 三 个 
TER ACK 事件 触发 。 在 这 种 情况 下 ， 网 络 继续 从 发 送 方向 接收 方 交付 报 文 段 〈 就 像 由 收 
HTAR ACK 所 指示 的 那样 ) 。 因 此 TCP 对 这 种 丢 包 事件 的 行为 ， 相 比 于 超时 指示 的 丢 包 ， 
应 当 不 那么 剧烈 : TCP 将 cwnd 的 值 减 半 (为 使 测量 结果 更 好 ， 计 及 已 收 到 的 3 个 宛 余 的 
ACK 要 加 上 3 个 MSS) ， 并 且 当 收 到 3 ARKI ACK, H ssthresh 的 值 记 录 为 ewnd 的 值 的 
一 半 。 接 下 来 进入 快速 恢复 状态 。 

3. 快速 恢复 

在 快速 恢复 中 ， 对 于 引起 TCP 进入 快速 恢复 状态 的 缺失 报 文 段 ， 对 收 到 的 每 个 宛 余 的 
ACK, cwnd 的 值 增加 一 个 MSS。 最 终 ， 当 对 丢失 报 文 段 的 一 个 ACK 到 达 时 ，TCP 在 降低 
cwnd 后 进入 拥塞 避免 状态 。 如 果 出 现 超时 事件 ， 快 速 恢复 在 执行 如 同 在 慢 启 动 和 拥塞 避 
免 中 相同 的 动作 后 ， 迁 移 到 慢 启 动 状态 : 当 丢 包 事 件 出 现时 ，cwnd 的 值 被 设置 为 1 个 
MSS， 并 且 ssthresh 的 值 设 置 为 ewnd 值 的 一 半 。 

快速 恢复 是 TCP 推荐 的 而 非 必需 的 构件 [RFC 5681]。 有 趣 的 是 ， 一 种 称 为 TCP 
Tahoe 的 TCP 早期 版 本 ， 不 管 是 发 生 超时 指示 的 丢 包 事件 ， 还 是 发 生 3 个 元 余 ACK 指示 
的 丢 包 事件 ， 都 无 条 件 地 将 其 拥塞 窗口 减 至 1 个 MSS， 并 进入 慢 启动 阶段 。TCP 的 较 新 版 
本 TCP Reno， 则 综合 了 快速 恢复 。 


图 3-52 图 示 了 Reno 版 TCP 45 Tahoe 版 TCP 的 拥塞 控制 窗口 的 演化 情况 。 在 该 图 中 ， 
准 值 初始 等 于 8 个 MSS。 在 前 8 个 传输 回 16 
合 ，Tahoe 和 Reno 采取 了 相同 的 动作 。 14 
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升 ， 在 第 4 SASHA BLA TBM. RER oe oo 

塞 窗口 以 线性 速度 他 升 ， 直 到 在 第 8 轮 传 RA 。 

输 后 出 现 3 个 元 余 ACK, ERIE FS? ot ee 
事件 发 生 时 ， 拥 塞 窗口 值 为 12 x MSS。 于 nie -| 

是 ssthresh 的 值 被 设置 为 0.5 x ewnd =6 x 0 


MSS, 在 TCP Reno F, 拥塞 窗口 被 设置 012.3 4/5 6 7 8 9 10:11 12 13 14 15 
为 ewnd = 9MSS， 然 后 线性 地 增长 。 在 Tae 
TCP Tahoe 下 ， 拥 塞 窗口 被 设置 为 1 个 图 3-52 TCP 拥塞 窗口 的 演化 (Tahoe 和 Reno) 
MSS， 然 后 呈 指 数 增长 ， 直 至 到 达 ssthresh 值 为 止 ， 在 这 个 点 它 开 始 线性 增长 。 

图 3-51 表示 了 TCP 拥塞 控制 算法 〈 即 慢 启 动 、 拥 塞 避免 和 快速 恢复 ) 的 完整 FSM Hi 
述 。 该 图 也 指示 了 新 报 文 段 的 传输 或 重 传 的 报 文 段 可 能 出 现 的 位 置 。 尽 管区 分 TCP 差错 控 
制 / 重 传 与 TCP 拥塞 控制 非常 重要 ,但 是 注意 到 TCP 这 两 个 方面 交织 链接 的 方式 也 很 
重要 。 

4. TCP 拥塞 控制 : 回顾 

在 深入 了 解 慢 启动 、 拥 塞 避 免 和 快速 恢复 的 细节 后 ， 现 在 有 必要 退回 来 回顾 一 下 全 
局 。 忽 略 一 条 连接 开始 时 初始 的 慢 启动 阶段 ,假定 丢 包 由 3 SITAR AY ACK 而 不 是 超时 指 
ax, TCP 的 拥塞 控制 是 : 每 个 RTT 内 cwnd 线性 (加 性 ) 增加 1MSS， 然 后 出 现 3 个 宛 余 
ACK 事件 时 ewnd WE (RER) Kk, TCP 拥塞 控制 常常 被 称 为 加 性 增 、 乘 性 减 
( Additive- Increase, Multiplicative- Decrease, AIMD) 拥塞 控制 方式 。AIMD 拥塞 控制 引发 了 . 
在 图 3-53 中 所 示 的 “ 句 上 从 ”行为 ， 这 也 
很 好 地 图 示 了 我 们 前 面 TCP 检测 带宽 时 24K 
的 直觉 ， 即 TCP 线性 地 增加 它 的 拥塞 窗 o 
口 长 度 〈 因 此 增加 其 传输 速率 ) ， 直 到 出 。 里 16K 
现 3 个 元 余 ACK 事件 。 然 后 以 2 个 因子 F 
来 减少 它 的 拥塞 窗口 长 度 ， 然 后 又 开始 了 8K 
线性 增长 ， 探 测 是 否 还 有 另外 的 可 用 


带宽 。 
如 前 所 述 ， 许 多 TCP 实现 采用 了 Re- 时 间 
no 算法 [Padhye 2001 ] Reno 算法 的 许 图 3-53 ”加 性 增 、 乘 性 减 的 拥塞 控制 


多 变种 已 被 提出 [RFC 3782; RFC 2018] 。TCP Vegas 算法 [Brakmo 1995; Ahn 1995] ist 
图 在 维持 较 好 的 吞吐 量 的 同时 避免 拥塞 。Vegas 的 基本 思想 是 : 中 在 分 组 丢失 发 生 之 前 ， 
在 源 与 目的 地 之 间 检 测 路 由 器 中 的 拥塞 ; 包 当 检测 出 快要 发 生 的 分 组 丢失 时 ， 线 性 地 降低 
发 送 速率 。 快 要 发 生 的 分 组 丢失 是 通过 观察 RTT 来 预测 的 。 分 组 的 RIT 越 长 ， 路 由 器 中 
的 拥塞 越 严重 。 到 2015 年 年 底 ，TCP 的 Ubuntu Linux 实现 默认 提供 了 慢 启动 、 拥 塞 避免 、 
快速 恢复 、 快 速 重 传 和 SACK， 也 提供 了 诸如 TCP Vegas 和 BIC [Xu 2004] 等 其 他 拥塞 控 
制 算法 。 对 于 许多 特色 TCP 的 综述 参见 [Afanasyev 2010], 
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TCP AIMD 算法 基于 大 量 的 工程 见解 和 在 运行 网 络 中 的 拥塞 控制 经 验 而 开发 。 在 TCP 
研发 后 的 十 年 ， 理 论 分 析 显 示 TCP 的 拥塞 控制 算法 用 做 一 种 分 布 式 异 步 优 化 算法 ， 使 得 用 
户 和 网 络 性 能 的 几 个 重要 方面 被 同时 优化 [Kelly 1998 ] 。 拥 塞 控制 的 丰富 理论 已 经 得 到 发 
展 [Srikant 2004] 。 

5. 对 TCP 吞吐 量 的 宏观 描述 

给 出 TCP 的 锯齿 状 行为 后 ， 自 然 要 考虑 一 个 长 存活 期 的 TCP 连接 的 平均 吞吐 量 ( 即 
平均 速率 ) 可 能 是 多 少 。 在 这 个 分 析 中 ， 我们 将 忽略 在 超时 事件 后 出 现 的 慢 启 动 阶段 。 
(这 些 阶 段 通常 非常 短 ， 因 为 发 送 方 很 快 就 以 指数 增长 离开 该 阶段 。) 在 一 个 特定 的 往返 间 
隔 内 ，TCP 发 送 数据 的 速率 是 拥塞 窗口 与 当前 RTT 的 函数 。 当 窗口 长 度 是 w 字 节 ， 且 当 
前 往返 时 间 是 RTT 秒 时 ， 则 TCP 的 发 送 速 率 大 约 是 w/RTT。 于 是 ，TCP 通过 每 经 过 1 个 
RIT 将 w 增 加 1 4+ MSS 探测 出 额外 的 带宽 ， 直 到 一 个 丢 包 事件 发 生 为 止 。 当 一 个 丢 包 事 
件 发 生 时 ， 用 下 表示 w 的 值 。 假 设 在 连接 持续 期 间 RTT A WLP AE, ABA TCP 的 传输 
速率 在 W/(2 x RIT) 到 W/RTT 之 间 变 化 。 

这 些 假设 导出 了 TCP 稳 态 行为 的 一 个 高 度 简化 的 宏观 模型 。 当 速率 增长 至 W/RTT 时 ， 
网 络 丢弃 来 自 连接 的 分 组 ; 然后 发 送 速率 就 会 减 半 ， 进 而 每 过 一 个 RIT 就 发 送 速 率 增加 
MSS/RTT， 直 到 再 次 达到 W/RTT 为 止 。 这 一 过 程 不 断 地 自我 重复 。 因 为 TCP 吞吐 量 (H 
速率 ) 在 两 个 极 值 之 间 线 性 增长 ， 所 以 我 们 有 


一 条 连接 的 平均 吞吐 量 = 


通过 这 个 高 度 理想 化 的 TCP 稳 态 动态 性 模型 ， 我 们 可 以 推出 一 个 将 连接 的 丢 包 率 与 可 
用 带宽 联系 起 来 的 有 趣 表达 式 [Mahdavi 1997 ] 。 这 个 推导 将 在 课 后 习题 中 概要 给 出 。 一 
个 根据 经 验 建 立 的 并 与 测量 数据 一 致 的 更 复杂 模型 参见 [ Padhye 2000 | 。 

6. 经 高 带宽 路 径 的 TCP 

认识 到 下 列 事实 是 重要 的 : TCP 拥塞 控制 已 经 演化 了 多 年 并 仍 在 继续 演化 。 对 当前 
TCP 变量 的 总 结 和 TCP 演化 的 讨论 ， 参 见 [Floyd 2001; RFC 5681; Afanasyev 2010]。 以 
往 对 因特网 有 益 的 东西 ( 那 时 大 量 的 TCP 连接 承载 的 是 SMTP, FTP Fil Telnet 流量 ) ， 不 一 
定 对 当今 HTTP 主宰 的 因特网 或 具有 难以 想象 的 服务 的 未 来 因特网 还 是 有 益 的 。 

TCP 继续 演化 的 需求 能 够 通过 考虑 网 格 和 云 计算 应 用 所 需要 的 高 速 TCP 连接 加 以 阐 
述 。 例 如 ， 考 虑 一 条 具有 1500 字 节 报 文 段 和 100ms RTT 的 TCP 连接 ， 假 定 我 们 要 通过 这 
条 连接 以 10Gbps 速率 发 送 数 据 。 根 据 [RFC 3649 ] ， 我 们 注意 到 使 用 上 述 TCP 吞吐 量 公 
st, 为 了 取得 10Gbps 吞吐 量 ， 平 均 拥塞 窗口 长 度 将 需要 是 83 333 个 报 文 段 。 对 如 此 大 量 
的 报 文 段 ， 使 我 们 相当 关注 这 83 333 个 传输 中 的 报 文 段 也 许 会 丢失 。 在 丢失 的 情况 下 ， 将 
会 出 现 什么 情况 呢 ? 或 者 以 另 一 种 方式 说 ， 这 些 传输 的 报 文 段 能 以 何 种 比例 丢失 ， 使 得 在 
图 3-52 中 列 出 的 TCP 拥塞 控制 算法 仍 能 取得 所 希望 的 10Gbps 速率 ? 在 本 章 的 课 后 习题 
中 ， 要 求 读者 推导 出 一 条 TCP 连接 的 吞吐 量 公式 ， 该 公式 作为 丢 包 率 (L), ER a] 
(RIT) 和 最 大 报 文 段 长 度 (MSS) 的 函数 : 


0.75 x W 


一 条 连接 的 平均 吞吐 量 = 122 x MSS 
RTT /L 


使 用 该 公式 ， 我 们 能 够 看 到 ， 为 了 取得 10Gbps HAEE, SRAI TCP 拥塞 控制 算法 





仅 能 容忍 2 x10 ”的 报 文 段 丢 失 概率 〈 或 等 价 地 说 ， 对 每 5 000 000 000 个 报 文 段 有 一 个 丢 
包 ) ， 这 是 一 个 非常 低 的 值 。 这 种 观察 导致 许多 研究 人 员 为 这 种 高 速 环境 特别 设计 新 版 
TCP， 对 这 些 努 力 的 讨论 参见 [Jin 2004; Kelly 2003; Ha 2008; RFC 7323 ] 。 


3.7.1 公平 性 


考虑 及 条 TCP 连接 ， 每 条 都 有 不 同 的 端 到 端 路 径 ， 但 是 都 经 过 一 段 传输 速率 为 R bps 
的 瓶颈 链 路 。( 所 谓 瓶 颈 链 路 ， 是 指 对 于 每 条 连接 ， 沿 着 该 连接 路 径 上 的 所 有 其 他 段 链 路 
都 不 拥 蹇 ， 而 且 与 该 瓶颈 链 路 的 传输 容量 相 比 ， 它 们 都 有 充足 的 传输 容量 。) 假设 每 条 连 
接 都 在 传输 一 个 大 文件 ， 而 且 无 UDP 流量 通过 该 段 瓶 颈 链 路 。 如 果 每 条 连接 的 平均 传输 
速率 接近 RAK， 即 每 条 连接 都 得 到 相同 份额 的 链 路 带宽 ， 则 认为 该 拥塞 控制 机 制 是 公 
平 的 。 

TCP 的 AIMD 算法 公平 吗 ? Ra eee BUS: 动 并 因此 在 某 个 给 定 的 时 间 点 
可 能 具有 不 同 的 窗口 长 度 情 况 下 ， 对 这 些 
不 同 的 TCP 连接 还 是 公平 的 吗 ? TCP 趋 于 


在 竞争 的 多 条 TCP 连接 之 间 提 供 对 一 段 瓶 N ii 
颈 链 路 带宽 的 平等 分 享 ， 其 理由 [Chiu MN 
1989] 给 出 了 一 个 极 好 的 、 直 观 的 解释 。 ye hse ne 

我 们 考虑 有 两 条 TCP 连接 共享 一 段 传 容量 R 


输 速率 为 R 的 链 路 的 简单 例子 ， 如 图 3-54 TCP% 
中 所 示 。 我 们 将 假设 这 两 条 连接 有 相同 的 图 3-54 ”两 条 TCP 连接 共享 同一 条 瓶颈 链 路 
MSS 和 RTT (这 样 如 果 它们 有 相同 的 拥塞 
窗口 长 度 ， 就 会 有 相同 的 吞吐 量 ) ， 它 们 有 
大 量 的 数据 要 发 送 ， 且 没有 其 他 TCP 连接 
或 UDP 数据 报 穿越 该 段 共享 链 路 。 我 们 还 pa 
将 忽略 TCP 的 慢 启 动 阶段 ， 并 假设 TCP 连 FERIRE 
接 一 直 按 CA 模式 (AIMD) 运行 。 

图 3-55 描绘 了 两 条 TCP 连接 实现 的 和 
吐 量 情况 。 如 果 TCP 要 在 这 两 条 TCP 连接 
之 间 平 等 地 共享 链 路 带宽 ， 那 么 实现 的 吞 
吐 量 曲线 应 当 是 从 原点 沿 45* 方 向 的 箭头 向 
外 辐射 (平等 带宽 共享 ) 。 理 想 情况 是 ， 两 
个 符 吐 量 的 和 应 等 于 R。 (当然 ， 每 条 连接 
得 到 相同 但 容量 为 0 的 共享 链 路 容量 并 非 
我 们 所 期 望 的 情况 !) 所 以 我 们 的 目标 应 该 ee i 
是 使 取得 的 吞吐 量 落 在 图 3-55 中 平等 带宽 。 ”图 3-55 TCP 连接 1 和 连接 2 实现 的 吞吐 量 
共享 曲线 与 全 带宽 利用 曲线 的 交叉 点 附近 的 某 处 。 

假定 TCP 窗口 长 度 是 这 样 的 ， 即 在 某 给 定时 刻 ， 连 接 1 和 连接 2 实现 了 由 图 3-55 中 A 
点 所 指明 的 吞吐 量 。 因 为 这 两 条 连接 共同 消耗 的 链 路 带宽 量 小 于 R， 所 以 无 丢 包 事件 发 
E, 根据 TCP 的 拥塞 避免 算法 的 结果 ， 这 两 条 连接 每 过 一 个 RIT 都 要 将 其 窗口 增加 1 个 
MSS。 因 此 ， 这 两 条 连接 的 总 吞吐 量 就 会 从 A 点 开始 沿 45° 线 前 行 (两 条 连接 都 有 相同 的 
增长 ) 。 最 终 ， 这 两 条 连接 共同 消耗 的 带宽 将 超过 R， 最 终 将 发 生 分 组 丢失 。 假 设 连接 1 







连接 2 的 吞吐 量 
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和 连接 2 实现 B 点 指明 的 吞吐 量 时 ， 它 们 都 经 历 了 分 组 丢失 。 连 接 1 和 连接 2 于 是 就 按 二 
分 之 一 减 小 其 窗口 。 所 产生 的 结果 实现 了 C 点 指明 的 吞吐 量 ， 它 正好 位 于 始 于 B 点 止 于 原 
点 的 一 个 向 量 的 中 间 。 因 为 在 C 点 ， 共 同 消耗 的 带宽 小 于 RR， 所 以 这 两 条 连接 再 次 沿 着 始 
FC 点 的 45? 线 增加 其 吞吐 量 。 最 终 ， 再 次 发 生 丢 包 事件 ， 如 在 D 点 ， 这 两 条 连接 再 次 将 
其 窗口 长 度 减 半 ， 如 此 等 等 。 你 应 当 搞 清楚 这 两 条 连接 实现 的 带宽 最 终 将 沿 着 平等 带宽 共 
享 曲线 在 波动 。 还 应 该 摘 清 楚 无 论 这 两 条 连接 位 于 二 维 空间 的 何 处 ， 它 们 最 终 都 会 收敛 到 
该 状态 ! 虽然 此 时 我 们 做 了 许多 理想 化 的 假设 ,但 是 它 仍然 能 对 解释 为 什么 TCP 会 导致 在 
多 条 连接 之 间 的 平等 共享 带宽 这 个 问题 提供 一 个 直观 的 感觉 。 

在 理想 化 情形 中 ， 我 们 假设 仅 有 TCP 连接 穿 过 瓶颈 链 路 ， 所 有 的 连接 具有 相同 的 RTT 
值 ， 且 对 于 一 个 主机 - 目的 地 对 而 言 只 有 一 条 TCP 连接 与 之 相关 联 。 实 践 中 ， 这 些 条 件 通 
常 是 得 不 到 满足 的 ， 客 户 - 服务 器 应 用 因此 能 获得 非常 不 平等 的 链 路 带宽 份额 。 特 别 是 ， 
已 经 表明 当 多 条 连接 共享 一 个 共同 的 瓶颈 链 路 时 ， 那 些 具 有 较 小 RIT 的 连接 能 够 在 链 路 空 
闲 时 更 快 地 抢 到 可 用 带宽 〈 即 较 快 地 打开 其 拥塞 窗口 ) ， 因 而 将 比 那 些 具有 较 大 RTT 的 连 
接 享用 更 高 的 吞吐 量 [Laksman 1997 ] 。 

1. 公平 性 和 UDP 

我 们 刚才 已 经 看 到 ，TCP 拥塞 控制 是 如 何 通过 拥塞 窗口 机 制 来 调节 一 个 应 用 程序 的 传 
输 速率 的 。 许 多 多 媒体 应 用 如 因特网 电话 和 视频 会 议 ， 经 常 就 因为 这 种 特定 原因 而 不 在 
TCP 上 运行 ， 因 为 它们 不 想 其 传输 速率 被 扼 制 ， 即 使 在 网 络 非常 拥塞 的 情况 下 。 相 反 ， 这 
些 应 用 宁可 在 UDP 上 运行 ，UDP 是 没有 内 置 的 拥塞 控制 的 。 当 运行 在 UDP 上 时 ， 这 些 应 
用 能 够 以 恒定 的 速率 将 其 音频 和 视频 数据 注入 网 络 之 中 并 且 偶 尔 会 丢失 分 组 ， 而 不 愿 在 拥 
塞 时 将 其 发 送 速率 降 至 “公平 ”级 别 并 且 不 丢失 任何 分 组 。 从 TCP 的 观点 来 看 ， 运 行 在 
UDP 上 的 多 媒体 应 用 是 不 公平 的 ， 因 为 它们 不 与 其 他 连接 合作 ， 也 不 适时 地 调整 其 传输 速 
率 。 因 为 TCP 拥塞 控制 在 面临 拥塞 增加 ( 丢 包 ) 时 ， 将 降低 其 传输 速率 ， 而 UDP 源 则 不 
必 这 样 做 ，UDP 源 有 可 能 压制 TCP 流量 。 当 今 的 一 个 主要 研究 领域 就 是 开发 一 种 因特网 
中 的 拥塞 控制 机 制 ， 用 于 阻止 UDP 流量 不 断 压制 直至 中 断 因特网 吞吐 量 的 情况 [ Floyd 
1999; Floyd 2000; Kohler 2006; RFC 4340], 

2. 公平 性 和 并 行 TCP 连接 

即使 我 们 能 够 迫使 UDP 流量 具有 公平 的 行为 ， 但 公平 性 问题 仍然 没有 完全 解决 。 这 
是 因为 我 们 没有 什么 办 法 阻止 基于 TCP 的 应 用 使 用 多 个 并 行 连接 。 例 如 ，Web 浏览 器 通常 
使 用 多 个 并 行 TCP 连接 来 传送 一 个 Web 页 中 的 多 个 对 象 。( 多 条 连接 的 确切 数目 可 以 在 多 
数 浏览 器 中 进行 配置 。) 当 一 个 应 用 使 用 多 条 并 行 连接 时 ， 它 占用 了 一 条 拥塞 链 路 中 较 大 
比例 的 带宽 。 举 例 来 说 ， 考 虑 一 段 速率 为 尺 且 支持 9 个 在 线 客 户 - 服务 器 应 用 的 链 路 ， 每 
个 应 用 使 用 一 条 TCP 连接 。 如 果 一 个 新 的 应 用 加 入 进来 ， 也 使 用 一 条 TCP 连接 ， 则 每 个 
应 用 得 到 差不多 相同 的 传输 速率 RA10。 但 是 如 果 这 个 新 的 应 用 这 次 使 用 了 11 个 并 行 TCP 
连接 ， 则 这 个 新 应 用 就 不 公平 地 分 到 超过 R/2 的 带宽 。Web 流量 在 因特网 中 是 非常 普遍 
的 ， 所 以 多 条 并 行 连接 并 非 不 常见 。 


3.7.2 明确 拥塞 通告 : 网 络 辅助 拥塞 控制 


自 20 世纪 80 年 代 后 期 慢 启 动 和 拥塞 避免 开始 标准 化 以 来 [RFC 1122], TCP BÆK 
现 了 端 到 端 拥塞 控制 的 形式 ， 我 们 在 3. 7. 1 节 中 对 此 进行 了 学 习 : 一 个 TCP 发 送 方 不 会 收 





到 来 自 网 络 层 的 明确 拥塞 指示 ， 而 是 通过 观察 分 组 丢失 来 推断 拥塞 。 最 近 ， 对 于 IP 和 
TCP 的 扩展 方案 [RFC 3168] 已 经 提出 并 已 经 实现 和 部 署 ， 该 方案 允许 网 络 明确 向 TCP 
发 送 方 和 接收 方 发 出 拥塞 信号 。 这 种 形式 的 网 络 辅助 拥塞 控制 称 为 明确 拥塞 通告 (Explicit 
Congestion Notification ，ECN ) 。 如 图 3-56 所 示 ， 涉 及 了 TCP Al IP HN. 






在 接收 方 到 发 送 方 的 TCP ACK 
报 文 段 中 设置 ECN 回 显 比特 
主机 A mam 
A * [ECN Echo=1 四 


在 拥塞 路 由 器 的 下 数据 
报 首部 设置 ECN 比 特 


图 3-56 ”明确 拥塞 通告 : 网 络 辅助 拥塞 控制 


在 网 络 层 ，IP 数据 报 首部 的 服务 类 型 字段 中 的 两 个 比特 (总 的 说 来 ， 有 四 种 可 能 的 
值 ) 被 用 于 ECN。 路 由 器 所 使 用 的 一 种 ECN 比特 设置 指示 该 路 由 器 正在 历经 拥塞 。 该 拥 
塞 指示 则 由 被 标记 的 IP 数据 报 所 携带 ， 送 给 目的 主机 ， 再 由 目的 主机 通知 发 送 主机 ， 如 
图 3-56 所 示 。RFC 3168 没有 提供 路 由 器 拥塞 时 的 定义 ; 该 判断 是 由 路 由 器 厂商 所 做 的 配 
置 选择 ， 并 且 由 网 络 操作 员 决 定 。 然 而 ，RFC 3168 推荐 仅 当 拥塞 持续 不 断 存在 时 才 设置 
ECN 比特 。 发 送 主机 所 使 用 的 男 一 种 ECN 比特 设置 通知 路 由 器 发 送 方 和 接收 方 是 ECN 使 
能 的 ， 因 此 能 够 对 于 ECN 指示 的 网 络 拥塞 采取 行动 。 

如 图 3-56 所 示 ， 当 接收 主机 中 的 TCP 通过 一 个 接收 到 的 数据 报 收 到 了 一 个 ECN 拥塞 
指示 时 ， 接 收 主机 中 的 TCP 通过 在 接收 方 到 发 送 方 的 TCP ACK 报 文 段 中 设置 ECE (明确 
拥塞 通告 回 显 ) 比特 (参见 图 3-29)， 通知 发 送 主机 中 的 TCP 收 到 拥塞 指示 。 接 下 来 ， 
TCP 发 送 方 通过 减 半 拥 塞 窗口 对 一 个 具有 ECE 拥塞 指示 的 ACK 做 出 反应 ， 就 像 它 对 丢失 
报 文 段 使 用 快速 重 传 做 出 反应 一 样 ， 并 且 在 下 一 个 传输 的 TCP 发 送 方 到 接收 方 的 报 文 段 首 
部 中 对 CWR (拥塞 窗口 缩减 ) 比特 进行 设置 。 

除了 TCP 以 外 的 其 他 运输 层 协 议 也 可 以 利用 网 络 层 发 送 ECN 信号 。 数 据 报 拥塞 控制 
协议 (Datagram Congestion Control Protocol, DCCP) [RFC 4340] 提供 了 一 种 低 开 销 、 控 制 
拥塞 的 类 似 UDP 不 可 靠 服务 ,该 协议 利用 了 ECN。DCTCP (数据 中 心 TCP) [Alizadeh 
2010] 是 一 种 专门 为 数据 中 心 网 络 设计 的 TCP 版 本 ， 也 利用 了 ECN。 


3.8 小 结 


本 章 我 们 首先 学 习 了 运输 层 协议 能 够 向 网 络 应 用 程序 提供 的 服务 。 在 一 个 极端 ， 运 输 
层 协 议 非常 简单 ， 并 向 应 用 程序 不 提供 不 必要 的 服务 ， 而 仅 向 通信 进程 提供 多 路 复 用 /分 
解 的 功能 。 因 特 网 中 的 UDP 协议 就 是 这 样 一 种 不 提供 不 必要 服务 的 运输 层 协议 。 在 男 一 
个 极端 ,运输 层 协议 能 够 向 应 用 程序 提供 各 种 各 样 的 保证 ， 例 如 数据 的 可 靠 交 付 、 时 延 保 
证 和 带宽 保证 。 无 论 如 何 ， 运 输 层 协议 能 够 提供 的 服务 经 常 受 下 面 网 络 层 协 议 服务 模型 的 
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限制 。 如 果 网 络 层 协议 不 能 向 运输 层 报 文 段 提 供 时 延 或 带宽 保证 ， 那 么 运输 层 协议 就 不 能 
向 进程 间 发 送 的 报 文 提供 时 延 或 带宽 保证 。 

在 3.4 节 中 ,我 们 学 习 了 运输 层 协 议 能 够 提供 可 靠 数 据 传 输 ， 即 使 下 面 的 网 络 层 是 不 
可 靠 的 。 我 们 看 到 了 提供 可 靠 的 数据 传送 会 遇 到 许多 微妙 的 问题 ,但 都 可 以 通过 精心 地 结 
合 确认 、 定 时 器 、 重 传 以 及 序号 机 制 来 完成 任务 。 

尽管 在 本 章 中 我 们 包含 了 可 靠 数据 传送 ， 但 是 我 们 应 该 理解 在 链 路 层 、 网 络 层 、 运 输 
层 或 应 用 层 协议 中 都 可 以 提供 可 靠 数据 传送 。 该 协议 栈 中 上 面 4 层 的 任意 一 层 都 可 以 实现 
确认 、 定 时 器 、 重 传 以 及 序号 ， 能 够 向 其 上 层 提 供 可 靠 数据 传送 。 事 实 上， 在 过 去 数 年 
中 ， 工 程 师 以 及 计算 机 科学 家 们 已 经 独立 地 设计 并 实现 了 提供 可 靠 数据 传送 的 链 路 层 、 网 
络 层 、 运 输 层 以 及 应 用 层 协议 〈 虽 然 这 些 协议 中 的 许多 已 经 销声匿迹 了 ) 。 

在 3.5 节 中 ,我 们 详细 地 研究 了 TCP 协议 ， 它 是 因特网 中 面向 连接 和 可 靠 的 运输 层 协 
议 。 我 们 知道 TCP 是 非常 复杂 的 ， 它 涉及 了 连接 管理 、 流 量 控制 、 往 返 时 间 估计 以 及 可 靠 
数据 传送 。 事 实 上 ，TCP 比 我 们 描述 的 要 更 为 复杂 ， 即 我 们 有 意 地 避 而 不 谈 在 各 种 TCP 实 
现 版 本 中 广泛 实现 的 各 种 TCP 补丁 、 修 复 和 改进 。 然 而 ， 所 有 这 些 复杂 性 都 对 网 络 层 应 用 
隐藏 了 起 来 。 如 果 某 主机 上 的 客户 希望 向 另 一 台 主 机 上 的 服务 器 可 靠 地 发 送 数据 ， 它 只 需 
要 打开 对 该 服务 器 的 一 个 TCP 套 接 字 ， 然 后 将 数据 注入 该 套 接 字 。 客 户 -服务 器 应 用 程序 
则 乐于 对 TCP 的 复杂 性 视而不见 。 

在 3.6 节 中 ， 我 们 从 广泛 的 角度 研究 了 拥塞 控制 ， 在 3.7 节 中 我 们 阐述 了 TCP 是 如 何 
实现 拥塞 控制 的 。 我 们 知道 了 拥塞 控制 对 于 网 络 良 好 运行 是 必 不 可 少 的 。 没 有 拥塞 控制 ， 
网 络 很 容易 出 现 死 锁 ， 使 得 端 到 端 之 间 很 少 或 没有 数据 能 被 传输 。 在 3. 7 节 中 我 们 学 习 了 
TCP 实现 的 一 种 端 到 端 拥塞 控制 机 制 ， 即 当 TCP 连接 的 路 径 上 判断 不 拥塞 时 ， 其 传输 速率 
就 加 性 增 ; 当 出 现 丢 包 时 ， 传 输 速 率 就 乘 性 减 。 这 种 机 制 也 致力 于 做 到 每 一 个 通过 拥塞 链 
路 的 TCP 连接 能 平等 地 共享 该 链 路 带宽 。 我 们 也 深入 探讨 了 TOP 连接 建立 和 慢 启动 对 时 
延 的 影响 。 我 们 观察 到 在 许多 重要 场合 ， 连 接 建 立 和 慢 启 动 会 对 端 到 端 时 延 产 生 严重 影 
响 。 我 们 再 次 强调 ， 尽 管 TCP 在 这 几 年 一 直 在 发 展 ， 但 它 仍 然 是 一 个 值得 深入 研究 的 领 
域 ， 并 且 在 未 来 的 几 年 中 还 可 能 持续 演化 。 

在 本 章 中 我 们 对 特定 因特网 运输 协议 的 讨论 集中 在 UDP 和 TCP 上 ， 它 们 是 因特网 运 
输 层 的 两 匹 “ 驮 马 ”。 然 而 ， 对 这 两 个 协议 的 二 十 多 年 的 经 验 已 经 使 人 们 认识 到 ， 这 两 个 
协议 都 不 是 完美 无 缺 的 。 研 究 人 员 因 此 在 忙于 研制 其 他 的 运输 层 协 议 ， 其 中 的 几 种 现在 已 
经 成 为 IETF 建议 的 标准 。 

数据 报 拥塞 控制 协议 (Datagram Congestion Control Protocol, DCCP) [RFC 4340] 提供 
了 一 种 低 开 销 、 面 向 报 文 、 类 似 于 UDP 的 不 可 靠 服务 ， 但 是 具有 应 用 程序 可 选择 的 拥塞 
控制 形式 ， 该 机 制 与 TCP 相 兼 容 。 如 果 某 应 用 程序 需要 可 靠 的 或 半 可 靠 的 数据 传送 ， 则 这 
将 在 应 用 程序 自身 中 执行 (也 许 使 用 我 们 已 经 在 3.4 节 中 学 过 的 机 制 ) DCCP 被 设想 用 
于 诸如 流 媒体 (参见 第 9 章 ) 等 应 用 程序 中 ，DCCP 能 够 利用 数据 交付 的 预定 时 间 和 可 靠 
性 之 间 的 折 中 ， 但 是 要 对 网 络 拥塞 做 出 响应 。 

在 谷歌 的 Chromium 浏览 器 中 实现 了 QUIC ( Quick UDP Internet Connections) 协议 
[ Iyengar 2016 ] ， 该 协议 通过 重 传 以 及 差错 检测 、 快 速 连接 建立 和 基于 速率 的 拥塞 控制 算 
法 提供 可 靠 性 ， 而 基于 速率 的 拥塞 控制 算法 是 以 TCP 友好 特性 为 目标 ， 这 些 机 制 都 是 在 
UDP 之 上 作为 应 用 层 协议 实现 的 。2015 年 年 初 ， 谷 歌 报告 从 Chrome 浏览 器 到 谷歌 服务 器 
的 大 约 一 半 请 求 运行 在 QUIC 之 上 。 





DCTCP (数据 中 心 TCP) [Alizadeh 2010] 是 一 种 专门 为 数据 中 心 网 络 设计 的 TCP 版 
Æ, (EH ECN 以 更 好 地 支持 短 流 和 长 流 的 混合 流 ， 这 种 混合 流 代 表 了 数据 中 心 负载 的 
特征 。 

流 控制 传输 协议 (Stream Control Transmission Protocol, SCTP) [ RFC 4960, RFC 3286 ] 
是 一 种 可 靠 的 、 面 向 报 文 的 协议 ， 该 协议 允许 几 个 不 同 的 应 用 层次 的 “ 流 ” 复 用 到 单个 
SCTP 连接 上 (一 种 称 之 为 “多 流 ” 的 方法 )。 从 可 靠 性 的 角度 看 ， 在 该 连接 中 的 不 同 流 
被 分 别处 理 ， 因 此 在 一 条 流 中 的 分 组 丢失 不 会 影响 其 他 流 中 数据 的 交付 。 当 一 台 主 机 与 两 
个 或 更 多 个 网 络 连接 时 ，SCTP 也 允许 数据 经 两 条 出 路 径 传输 ， 还 具有 失 序 数据 的 选项 交 
付 和 一 些 其 他 特色 。SCTP 的 流 控 制 和 拥塞 控制 算法 基本 上 与 TCP 中 的 相同 。 

TCP 友好 速率 控制 (TCP- Friendly Rate Control, TFRC) 协议 [RFC 5348] 是 一 种 拥 
塞 控制 协议 而 不 是 一 种 功能 齐全 的 运输 层 协议 。 它 定义 了 一 种 拥塞 控制 机 制 ， 该 机 制 能 被 
用 于 诸如 DCCP 等 其 他 运输 协议 (事实 上 在 DCCP 中 可 供 使 用 的 两 种 应 用 程序 可 选 的 协议 
之 一 就 是 TFRC ) TFRC 的 目标 是 平滑 在 TCP 拥塞 控制 中 的 “锯齿 ”行为 (参见 
图 3-53) ， 同 时 维护 一 种 长 期 的 发 送 速率 ， 该 速率 “合理 地 ”接近 TCP 的 速率 。 使 用 比 
TCP 更 为 平滑 的 发 送 速率 ，TFRC 非常 适合 诸如 IP 电话 或 流 媒 体 等 多 媒体 应 用 ， 这 种 平滑 
的 速率 对 于 这 些 应 用 是 重要 的 。TFRC 是 一 种 “基于 方程 ”的 协议 ， 这 些 协 议 使 用 测 得 的 
丢 包 率 作为 方程 的 输入 [Padhye 2000] ， 即 使 用 方程 估计 一 个 TCP 会 话 在 该 丢 包 率 下 TCP 
的 吞吐 量 将 是 多 大 。 该 速率 则 被 取 为 TFRC 的 目标 发 送 速率 。 

唯 有 未 来 才能 告诉 我 们 DCCP, SCTP, QUIC 或 TFRC 是 否 能 得 到 广泛 实施 。 虽 然 这 些 
协议 明确 地 提供 了 超过 TCP 和 UDP 的 强化 能 力 ， 但 是 多 年 来 已 经 证 明了 TCP 和 UDP 自身 
是 “足够 好 ”的 。 是 否 “ 更 好 ”将 胜出 “足够 好 ”， 这 将 取决 于 技术 、 社 会 和 商业 考虑 的 
复杂 组 合 。 

在 第 1 章 中 ， 我 们 讲 到 计算 机 网 络 能 被 划分 成 “网 络 边缘 ”和 “网 络 核心 。 网 络 边 
缘 包 含 了 在 端 系统 中 发 生 的 所 有 事情 。 既 然 已 经 覆盖 了 应 用 层 和 运输 层 ， 我 们 关于 网 络 边 
缘 的 讨论 也 就 结束 了 。 接 下 来 是 探寻 网 络 核心 的 时 候 了 ! 我 们 的 旅程 从 下 一 章 开 始 ， 下 一 
章 将 学 习 网 络 层 ， 并 且 将 在 第 6 章 继续 学 习 链 路 层 。 


课 后 习题 和 问题 





3.1~3.3 节 

RI. 假定 网 络 层 提 供 了 下 列 服务 。 在 源 主机 中 的 网 络 层 接受 最 大 长 度 1200 字 节 和 来 自 运输 层 的 目的 主机 
地 址 的 报 文 段 。 网 络 层 则 保证 将 该 报 文 段 交付 给 位 于 目的 主机 的 运输 层 。 假 定 在 目的 主机 上 能 够 运 
行 许多 网 络 应 用 进程 。 
a 设计 可 能 最 简单 的 运输 层 协议 ， 该 协议 将 使 应 用 程序 数据 到 达 位 于 目的 主机 的 所 希望 的 进程 。 假 

设 在 目的 主机 中 的 操作 系统 已 经 为 每 个 运行 的 应 用 进程 分 配 了 一 个 4 字 节 的 端口 号 。 

b. 修改 这 个 协议 , 使 它 向 目的 进程 提供 一 个 的 “返回 地 址 ”。 
c. 在 你 的 协议 中 ， 该 运输 层 在 计算 机 网 络 的 核心 中 “必须 做 任何 事 ” 吗 ? 

R2. 考虑 有 一 个 星球 ， 每 个 人 都 属于 某 个 六 口 之 家 ， 每 个 家 庭 都 住 在 自己 的 房子 里 ， 每 个 房子 都 一 个 唯 
一 的 地 址 ， 并 且 某 给 定 家 庭 中 的 每 个 人 有 一 个 独特 的 名 字 。 假 定 该 星球 有 一 个 从 源 家 庭 到 目的 家 庭 
交付 信件 的 邮政 服务 。 该 邮件 服务 要 求 : 叫 在 一 个 信封 中 有 一 封 信 ; 四 在 信封 上 清楚 地 写 上 目的 家 
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庭 的 地 址 〈 并 且 没有 别 的 东西 ) 。 假 设 每 个 家 庭 有 一 名 家 庭 成 员 代表 为 家 庭 中 的 其 他 成 员 收集 和 分 

发 信件 。 这 些 信 没 有 必要 提供 任何 有 关 信 的 接收 者 的 指示 。 

a. 使 用 对 上 面 复 习题 R1 的 解决 方案 作为 启发 ， 描 述 家 庭 成 员 代表 能 够 使 用 的 协议 ， 以 从 发 送 家 庭 
成 员 向 接收 家 庭 成 员 交 付 信件 。 

b. 在 你 的 协议 中 ， 该 邮政 服务 必须 打开 信封 并 检查 信件 内 容 才 能 提供 它 的 服务 吗 ? 

R3. 考虑 在 主机 A 和 主机 了 之 间 有 一 条 TCP 连接 。 假 设 从 主机 A 传送 到 主机 了 的 TCP 报 文 段 具有 源 端口 
号 zx 和 目的 端口 号 y。 对 于 从 主机 B 传送 到 主机 A 的 报 文 段 ， 源 端口 号 和 目的 端口 号 分 别 是 多 少 ? 

R4. 描述 应 用 程序 开发 者 为 什么 可 能 选择 在 UDP 上 运行 应 用 程序 而 不 是 在 TCP 上 运行 的 原因 。 

R5. 在 今天 的 因特网 中 ， 为 什么 语音 和 图 像 流 量 常常 是 经 过 TCP 而 不 是 经 UDP 发 送 。( 提示: 我 们 寻找 
的 答案 与 TCP 的 拥塞 控制 机 制 没有 关系 。) 

R6. 当 某 应 用 程序 运行 在 UDP 上 时 ， 该 应 用 程序 可 能 得 到 可 靠 数据 传输 吗 ? 如 果 能 ， 如 何 实现 ? 

R7. 假定 在 主机 C 上 的 一 个 进程 有 一 个 具有 端口 号 6789 的 UDP 套 接 字 。 假 定 主机 A 和 主机 B 都 用 目的 
端口 号 6789 向 主机 C 发 送 一 个 UDP 报 文 段 。 这 两 从 主机 的 这 些 报 文 段 在 主机 C 都 被 描述 为 相同 的 
套 接 字 吗 ?如 果 是 这 样 的 话 ， 在 主机 C 的 该 进程 将 怎样 知道 源 于 两 台 不 同 主机 的 这 两 个 报 文 段 ? 

R8. 假定 在 主机 C 端口 80 上 运行 的 一 个 Web 服务 器 。 假 定 这 个 Web 服务 器 使 用 持续 连接 ， 并 且 正 在 接 
收 来 自 两 台 不 同 主机 A ALB 的 请 求 。 被 发 送 的 所 有 请 求 都 通过 位 于 主机 C 的 相同 套 接 字 吗 ? MRE 
们 通过 不 同 的 套 接 字 传递 ， 这 两 个 套 接 字 都 具有 端口 80 吗 ? 讨论 和 解释 之 。 

3.4 节 

R9. 在 我 们 的 rdt 协议 中 ， 为 什么 需要 引入 序号 ? 

R10. 在 我 们 的 rdt 协议 中 ， 为 什么 需要 引入 定时 器 ? 

R11. 假定 发 送 方 和 接收 方 之 间 的 往返 时 延 是 固定 的 并 且 为 发 送 方 所 知 。 假 设 分 组 能 够 丢失 的 话 ， 在 协议 
rdt3. 0 中 ， 一 个 定时 器 仍 是 必需 的 吗 ? 试 解释 之 。 

R12. 在 配套 网 站 上 使 用 Go-Back-N (EB N 步 ) Java 小 程序 。 

a. 让 源 发 送 5 个 分 组 ， 在 这 5 个 分 组 的 任何 一 个 到 达 目 的 地 之 前 暂停 该 动画 。 然 后 毁 掉 第 一 个 分 组 
并 继续 该 动画 。 试 描述 发 生 的 情况 。 

b 重复 该 实验 ， 只 是 现在 让 第 一 个 分 组 到 达 目的 地 并 毁 掉 第 一 个 确认 。 再 次 描述 发 生 的 情况 。 

c. 最 后 ， 尝 试 发 送 6 个 分 组 。 发 生 了 什么 情况 ? 

R13. 重复 复习 题 R12， 但 是 现在 使 用 Selective Repeat (选择 重 传 ) Java 小 程序 。 选 择 重 传 和 回 退 N 步 有 
什么 不 同 ? 

3.5 节 

R14. 是 非 判 断 题 : 

a. 主机 A 经 过 一 条 TCP 连接 向 主机 B 发 送 一 个 大 文件 。 假 设 主机 B 没有 数据 发 往 主机 A。 因 为 主 
机 B 不 能 随 数 据 撒 带 确认 ， 所 以 主机 B 将 不 向 主机 A 发 送 确认 。 

b. 在 连接 的 整个 过 程 中 ，TCP 的 rwnd 的 长 度 决 不 会 变化 。 

c. 假设 主机 A 通过 一 条 TCP 连接 向 主机 B 发 送 一 个 大 文件 。 主 机 A 发 送 但 未 被 确认 的 字 节 数 不 会 
超过 接收 缓存 的 大 小 。 

d. 假设 主机 A 通过 一 条 TCP 连接 向 主机 B 发 送 一 个 大 文件 。 如 果 对 于 这 条 连接 的 一 个 报 文 段 的 序 
号 为 m， 则 对 于 后 继 报 文 段 的 序号 将 必然 是 m+1。 

e. TOP 报 文 段 在 它 的 首部 中 有 一 个 rwd 字段 。 

f 假定 在 一 条 TCP 连接 中 最 后 的 SampleRTT 等 于 1 秒 ， 那 么 对 于 该 连接 的 TimeoutInterval 的 当前 值 
必定 大 于 等 于 1 秒 。 

g 假设 主机 A 通过 一 条 TCP 连接 向 主机 B 发 送 一 个 序号 为 38 的 4 个 字 节 的 报 文 段 。 在 这 个 相同 的 
报 文 段 中 ， 确 认 号 必定 是 42。 

R15. 假设 主机 A 通过 一 条 TCP 连接 向 主机 B 发 送 两 个 紧 接着 的 TCP 报 文 段 。 第 一 个 报 文 段 的 序号 为 90， 
第 二 个 报 文 段 序号 为 110。 
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a 第 一 个 报 文 段 中 有 多 少数 据 ? 
b 假设 第 一 个 报 文 段 丢失 而 第 三 个 报 文 段 到 达 主 机 B。 那 么 在 主机 B 发 往 主机 A 的 确认 报 文 中 ， 
确认 号 应 该 是 多 少 ? 

R16. 考虑 在 3.5 节 中 讨论 的 Telnet 的 例子 。 在 用 户 键 人 字符 C 数秒 之 后 ， 用 户 又 键入 字符 R。 那 么 在 用 
户 键入 字符 R 之 后 ， 总 共 发 送 了 多 少 个 报 文 段 ， 这 些 报 文 段 中 的 序号 和 确认 字段 应 该 填 人 什么 ? 

3.7 节 

R17. 假设 两 条 TCP 连接 存在 于 一 个 带宽 为 R bps 的 瓶颈 链 路 上 。 它 们 都 要 发 送 一 个 很 大 的 文件 〈 以 相同 
方向 经 过 瓶颈 链 路 ) ， 并 且 两 者 是 同时 开始 发 送 文件 。 那 么 TCP 将 为 每 条 连接 分 配 什么 样 的 传输 
速率 ? 

R18. 是 非 判 断 题 。 考 虑 TCP 的 拥塞 控制 。 当 发 送 方 定时 器 超时 时 ， 其 ssthresh 的 值 将 被 设置 为 原来 值 的 
一 半 。 

R19. 在 3.7 节 的 “TCP 分 岔 ”讨论 中 ,对 于 TCP 分 岔 的 响应 时 间 ， 断 言 大 约 是 4* RIT), + RTT), + 处 理 
时 间 。 评 价 该 断言 。 


习题 


Pl. 假设 客户 A 向 服务 器 S 发 起 一 个 Telnet 会 话 。 与 此 同时 ， 客 户 B 也 向 服务 器 $ 发 起 一 个 Telnet 会 话 。 

给 出 下 面 报 文 段 的 源 端 口号 和 目的 端口 号 : 

a. 从 A 向 S 发 送 的 报 文 段 。 

b. JAB 向 S 发 送 的 报 文 段 。 

c KAS 向 A 发 送 的 报 文 段 。 

d. 从 5S 向 B 发 送 的 报 文 段 。 

e WIR A 和 B 是 不 同 的 主机 ， 那么 从 A 向 S 发 送 的 报 文 段 的 源 端 口号 是 否 可 能 与 从 B 向 S 发 送 的 报 

文 段 的 源 端口 号 相同 ? 

f 如 果 它 们 是 同一 台 主 机 ， 情 况 会 怎么 样 ? 

P2. 考虑 图 3-5。 从 服务 器 返回 客户 进程 的 报 文 流 中 的 源 端口 号 和 目的 端口 号 是 多 少 ? 在 承载 运输 层 报 文 
段 的 网 络 层 数 据 报 中 ，IP 地 址 是 多 少 ? 

P3. UDP 和 TCP 使 用 反 码 来 计算 它们 的 检验 和 。 假 设 你 有 下 面 3 个 8 比特 字 节 : 01010011, 01100110, 
01110100。 这 些 8 比特 字 节 和 的 反 码 是 多 少 ? (注意 到 尽管 UDP 和 TCP 使 用 16 比特 的 字 来 计算 检验 
和 ， 但 对 于 这 个 问题 ， 你 应 该 考虑 8 比特 和 。) 写 出 所 有 工作 过 程 。UDP 为 什么 要 用 该 和 的 反 码 ， 即 
为 什么 不 直接 使 用 该 和 呢 ? 使 用 该 反 码 方案 ， 接 收 方 如 何 检测 出 差错 ? 1 比特 的 差错 将 可 能 检测 不 出 
来 吗 ? 2 比特 的 差错 呢 ? 

P4. a. 假定 你 有 下 列 2 个 字 节 : 01011100 和 01100101。 这 2 个 字 节 之 和 的 反 码 是 什么 ? 

b. 假定 你 有 下 列 2 个 字 节 : 11011010 和 01100101。 这 2 个 字 节 之 和 的 反 码 是 什么 ? 
c 对 于 ka) 中 的 字 节 ， 给 出 一 个 例子 ， 使 得 这 2 个 字 节 中 的 每 一 个 都 在 一 个 比特 反 转 时 ， 其 反 码 不 
会 改变 。 

PS. 假定 某 UDP 接收 方 对 接收 到 的 UDP 报 文 段 计算 因特网 检验 和 ， 并 发 现 它 与 承载 在 检验 和 字段 中 的 值 
相 匹配 。 该 接收 方 能 够 绝对 确信 没有 出 现 过 比特 差错 吗 ? 试 解 释 之 。 

P6. 考虑 我 们 改正 协议 rd2. 1 的 动机 。 试 说 明 如 图 3-57 所 示 的 接收 方 与 如 图 3-11 所 示 的 发 送 方 运行 时 ， 
接收 方 可 能 会 引起 发 送 方 和 接收 方 进入 死 锁 状态 ， 即 双方 都 在 等 待 不 可 能 发 生 的 事件 。 

P7. 在 rdt3.0 协议 中 ， 从 接收 方向 发 送 方 流动 的 ACK 分 组 没有 序号 (尽管 它们 具有 ACK 字段 ， 该 字段 包 
括 了 它们 正在 确认 的 分 组 的 序号 ) 。 为 什么 这 些 ACK 分 组 不 需要 序号 呢 ? 

P8. 画 出 协议 rdt3.0 中 接收 方 的 FSM, 

PO. 当 数 据 分 组 和 确认 分 组 发 生 纂 改 时 ， 给 出 rdB3.0 协议 运行 的 轨迹 。 你 画 的 轨迹 应 当 类 似 于 图 3-16 中 
所 用 的 图 。 

P10. 考虑 一 个 能 够 丢失 分 组 但 其 最 大 时 延 已 知 的 信道 。 修 改 协 议 rd2. 1， 以 包括 发 送 方 超时 和 重 传 机 制 。 
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rdt_rev (revpkt) && ”等 待 来 自 等 待 来 


非 正 式 地 论证 : 为 什么 你 的 协议 能 够 通过 该 信道 正确 通信 ? 
rdt_rve(revpkt) && notcorrupt (rcvpkt) 
&& has_seq0 (revpkt) 


extract (rcvpkt, data) 
deliver_data (data) 

compute chksum 

make_pkt (sendpkt, ACK, chksum) 
udt_send (sndpkt) 


rdt_rcv(revpkt) && 
alas (corrupt (rcevpkt) | | 
a has_seq0 (revpkt))) 
compute chksum 
自 make_pkt (sndpkts NAK, chksum) 


ea ees i e 
(corrupt (revpkt) | | 下 层 的 0 下 层 的 1 udt_send (sndpkt) 


has_seql (rcvpkt) )) 


compute chksum 
make_pkt (sndpkt, NAK, chksum) 


udt_send(sndpkt) rdt_rve(revpkt) && notcorrupt (rcvpkt) 


P11. 


P12: 


P13. 


P14. 


P15. 


P16. 


P17. 


&& has_seql (rcvpkt) 


extract (rcvpkt, data) 
deliver_data (data) 

compute chksum 

make_pkt (sendpkt, ACK, chksum) 
udt_send (sndpkt) 


图 3-57 协议 rd2. 1 的 一 个 不 正确 的 接收 方 


考虑 在 图 3-14 中 的 rdt2.2 接收 方 ， 在 状态 “等 待 来 自 下 层 的 0” 和 状态 “等 待 来 自 下 层 的 1” 中 的 
自转 换 〈 即 从 某 状态 转换 回 自身 ) 中 生成 一 个 新 分 组 : sndpk =make_ pkt (ACK, 1, checksum) 和 
sndpk =make_pkt (ACK，0，checksum) 。 如 果 这 个 动作 从 状态 “等 待 来 自 下 层 的 1” 中 的 自转 换 
中 删除 ， 该 协议 将 正确 工作 吗 ? 评估 你 的 答案 。 在 状态 “等 待 来 自 下 层 的 0” 中 的 自转 换 中 删除 这 
个 事件 将 会 怎样 ? [提示 : 在 后 一 种 情况 下 ， 考 虑 如 果 第 一 个 发 送 方 到 接收 方 的 分 组 损坏 的 话 ， 将 
会 发 生 什么 情况 ?] 

rdt3.0 协议 的 发 送 方 直接 忽略 ( 即 不 采取 任何 动作 ) 接收 到 的 所 有 出 现 差错 和 确认 分 组 的 确认 号 
(acknum) 字段 中 的 值 有 差错 的 分 组 。 假设 在 这 种 情况 下 ，rdt3.0 只 是 重 传 当 前 的 数据 分 组 ， 该 协 
议 是 否 还 能 正常 运行 ? (提示 :考虑 在 下 列 情况 下 会 发 生 什 么 情况 : 仅 有 一 个 比特 差错 时 ; 报 文 没 
有 丢失 但 能 出 现 定 时 器 过 早 超时 。 考 虑 到 当 n ETENN, E n 个 分 组 将 被 发 送 多 少 次 。) 

考虑 rdt3.0 协议 。 如 果 发 送 方 和 接收 方 的 网 络 连接 能 够 对 报 文 重 排序 即 在 发 送 方 和 接收 方 之 间 的 
媒体 上 传播 的 两 个 报 文 段 能 重新 排序 ) ， 那 么 比特 交替 协议 将 不 能 正确 工作 (确信 你 清楚 地 理解 这 
时 它 不 能 正确 工作 的 原因 ) ， 试 画图 说 明之 。 画 图 时 把 发 送 方 放 在 左边 ， 接 收 方 放 在 右边 ， 使 时 间 
轴 朝 下 ， 标 出 交换 的 数据 报 文 (D) 和 确认 报 文 (A)。 要 标明 与 任何 数据 和 确认 报 文 段 相 关 的 
序号 。 

考虑 一 种 仅 使 用 否定 确认 的 可 靠 数 据 传输 协议 。 假 定 发 送 方 只 是 偶尔 发 送 数据 。 只 用 NAK 的 协议 
是 否 会 比 使 用 ACK 的 协议 更 好 ? 为 什么 ? 现在 我 们 假设 发 送 方 要 发 送 大 量 的 数据 ， 并 且 该 端 到 端 
连接 很 少 丢 包 。 在 第 二 种 情况 下 ， 只 用 NAK 的 协议 是 否 会 比 使 用 ACK 的 协议 更 好 ? 为 什么 ? 
考虑 显示 在 图 3-17 中 的 网 络 跨 越 国家 的 例子 。 窗 口 长 度 设置 成 多 少时 ， 才 能 使 该 信道 的 利用 率 超过 
90% ? 假设 分 组 的 长 度 为 1500 字 节 (包括 首部 字段 和 数据 ) 。 

假设 某 应 用 使 用 rd3. 0 作为 其 运输 层 协议 。 因 为 停 等 协议 具有 非常 低 的 信道 利用 率 (显示 在 网 络 跨 
越 国家 的 例子 中 ) ， 该 应 用 程序 的 设计 者 让 接收 方 持续 回 送 许多 (大 于 2) 交替 的 ACK 0 和 ACK 1, 
即使 对 应 的 数据 未 到 达 接 收 方 。 这 个 应 用 程序 设计 将 能 增加 信道 利用 率 吗 ? 为 什么 ? 该 方法 存在 某 
种 潜在 的 问题 吗 ? 试 解释 之 。 

考虑 两 个 网 络 实体 A 和 B， 它 们 由 一 条 完善 的 双向 信道 所 连接 ( 即 任何 发 送 的 报 文 将 正确 地 收 到 ; 


P18. 


P19. 


P20. 


P21. 


P22. 


P23. 
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信道 将 不 会 损坏 、 丢 失 或 重 排 序 分 组 ) 。A 和 B 将 以 交互 的 方式 彼此 交付 报 文 : 首先 ，A 必须 向 B 
交付 一 个 报 文 ，B 然后 必须 向 A 交付 一 个 报 文 ， 接 下 来 A 必须 向 B 交付 一 个 报 文 ， 等 等 。 如 果 一 个 
实体 处 于 它 不 试图 向 另 一 侧 交付 报 文 的 状态 ， 将 存在 一 个 来 自 上 层 的 类 似 于 rdt_send( data) 调 用 的 
事件 ， 它 试图 向 下 传送 数据 以 向 另 一 侧 传输 ,来 自 上 层 的 该 调用 能 够 直接 忽略 对 于 rdt_unable_to_ 
send( data) 调用 ， 这 通知 较 高 层 当 前 不 能 够 发 送 数据 。[ 注意 : 做 出 这 种 简化 的 假设 ,使 你 不 必 担 心 
缓存 数据 。j 

对 该 协议 画 出 FSM 说 明 (一 个 FSM HFA, 一 个 FSM 用 于 B)。 注 意 你 不 必 担 心 这 里 的 可 靠 性 
机 制 ， 该 问题 的 要 点 在 于 创建 反映 这 两 个 实体 的 同步 行为 的 FSM 说 明 。 应 当 使 用 与 图 3-9 中 协议 
rdtl. 0 有 相同 含义 的 下 列 事件 和 动作 : rdt_send( data), packet = make_pkt( data), udt__send( data) , 
rdt_rev( packet) ，extract( packet, data) ，deliver_data( data) 。 保 证 你 的 协议 反映 了 A 和 B 之 间 发 送 的 
严格 交替 。 还 要 保证 在 你 的 FSM 描述 中 指出 A 和 B 的 初始 状态 。 
在 3.4.4 节 我 们 学 习 的 一 般 性 SR 协议 中 ， 只 要 报 文 可 用 〈 如 果 报 文 在 窗口 中 ) ， 发 送 方 就 会 不 等 待 
确认 而 传输 报 文 。 假 设 现 在 我 们 要 求 一 个 SR 协议 ， 一 次 发 出 一 对 报 文 ， 而 且 只 有 在 知道 第 一 对 报 
文中 的 两 个 报 文 都 正确 到 达 后 才 发 送 第 二 对 报 文 。 

假设 该 信道 中 可 能 会 丢失 报 文 ， 但 报 文 不 会 发 生 损坏 和 失 序 。 试 为 报 文 的 单 向 可 靠 传 输 而 设计 
一 个 差错 控制 协议 。 画 出 发 送 方 和 接收 方 的 FSM 描述。 描述 在 发 送 方 和 接收 方 之 间 两 个 方向 发 送 的 
报 文 格式 。 如 果 你 使 用 了 不 同 于 3.4 节 (例如 udt_send( ) 、start_timer( )、rdt_rev( ) 等 ) 中 的 任何 
其 他 过 程 调 用 ， 详 细 地 阐述 这 些 动 作 。 举 例 说 明 (用 发 送 方 和 接收 方 的 时 序 踪 迹 图 ) 你 的 协议 是 如 
何 恢复 报 文 丢失 的 。 
考虑 一 种 情况 ， 主 机 A 想 同时 向 主机 B 和 主机 C 发 送 分 组 。A 与 B 和 C 是 经 过 广播 信道 连接 的 ， 即 
由 A 发 送 的 分 组 通过 该 信道 传送 到 B 和 C。 假设 连接 A、B 和 C 的 这 个 广播 信道 具有 独立 的 报 文 丢 
失 和 损坏 特性 (例如 ， 从 A 发 出 的 报 文 可 能 被 B 正确 接收 , 但 没有 被 C 正确 接收 )。 设 计 一 个 类 似 
于 停 等 协议 的 差错 控制 协议 ， 用 于 从 A 可 靠 地 传输 分 组 到 B 和 C。 该 协议 使 得 A 直到 得 知 B 和 C 已 
经 正确 接收 到 当前 报 文 ， 才 获取 上 层 交 付 的 新 数据 。 给 出 A ALC 的 FSM 描述 。( 提 示 : B 的 FSM 大 
体 上 应 当 与 C 的 相同 。) 同时 ， 给 出 所 使 用 的 报 文 格式 的 描述 。 
考虑 一 种 主机 A 和 主机 B 要 向 主机 C 发送 报 文 的 情况 。 主 机 A 和 C 通过 一 条 报 文 能 够 丢失 和 损坏 
(但 不 重 排序 ) 的 信道 相连 接 。 主 机 B 和 C 由 另 一 条 (与 连接 A 和 C 的 信道 独立 ) 具有 相同 性 质 的 
信道 连接 。 在 主机 C 上 的 运输 层 ， 在 向 上 层 交 付 来 自主 机 A ALB 的 报 文 时 应 当 交 蔡 进行 〈 即 它 应 当 
首先 交付 来 自 A 的 分 组 中 的 数据 ， 然 后 是 来 自 B 的 分 组 中 的 数据 ， 等 等 ) 。 设 计 一 个 类 似 于 停 等 协 
议 的 差错 控制 协议 ， 以 可 靠 地 向 C 传输 来 自 A 和 B 的 分 组 ， 同 时 以 前 面 描述 的 方式 在 C 处 交替 地 交 
付 。 给 出 A 和 C 的 FSM 描述 。( 提 示 : BAY FSM 大 体 上 应 当 与 A 的 相同 。) 同时 ， 给 出 所 使 用 的 报 
文 格式 的 描述 。 
假定 我 们 有 两 个 网 络 实体 A 和 B。B 有 一 些 数据 报 文 要 通过 下 列 规则 传 给 A。 当 A 从 其 上 层 得 到 一 
SER. BUA B 获取 下 一 个 数据 (D) 报 文 。A 必须 通过 A 一 B 信道 向 B 发 送 一 个 请 求 (R) 报 文 。 
仅 当 B 收 到 一 个 R 报 文 后 ， 它 才 会 通过 B 一 A 信道 向 A 发 送 一 个 数据 (D) 报 文 。A 应 当 准确 地 将 
每 份 D 报 文 的 副本 交付 给 上 层 。R 报 文 可 能 会 在 A 一 B 信道 中 丢失 〈 但 不 会 损坏 ); D 报 文 一 旦 发 
出 总 是 能 够 正确 交付 。 两 个 信道 的 时 延 未 知 且 是 变化 的 。 

设计 一 个 协议 (给 出 FSM 描述 )， 它 能 够 综合 适当 的 机 制 ， 以 补偿 会 丢 包 的 A 一 B 信道 ， 并 且 
实现 在 A 实体 中 向 上 层 传递 报 文 。 只 采用 绝对 必要 的 机 制 。 
考虑 一 个 GBN 协议 ， 其 发 送 方 窗口 为 4， 序 号 范围 为 1024。 假 设 在 时 刻 :， 接 收 方 期 待 的 下 一 个 有 
序 分 组 的 序号 是 。 假设 媒体 不 会 对 报 文 重新 排序 。 回 答 以 下 问题 : 
a 在 1 时 刻 ， 发 送 方 窗口 内 的 报 文 序号 可 能 是 多 少 ? 论证 你 的 回答 。 
b. 在 1 时刻， 在 当前 传播 回 发 送 方 的 所 有 可 能 报 文中 ，ACK 字段 的 所 有 可 能 值 是 多 少 ? 论证 你 的 

回答 。 

考虑 CBN 协议 和 SR 协议 。 假 设 序号 空间 的 长 度 为 k， 那么 为 了 避免 出 现 图 3-27 中 的 问题 ， 对 于 这 
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两 种 协议 中 的 每 一 种 ， 人 允许 的 发 送 方 窗口 最 大 为 多 少 ? 

对 下 面 的 问题 判断 是 非 ， 并 简要 地 证 实 你 的 回答 : 

a 对 于 SR 协议 ， 发 送 方 可 能 会 收 到 落 在 其 当前 窗口 之 外 的 分 组 的 ACK。 

b. 对 于 CBN 协议 ， 发 送 方 可 能 会 收 到 落 在 其 当前 窗口 之 外 的 分 组 的 ACK。 

c， 当 发 送 方 和 接收 方 窗口 长 度 都 为 1 时 ， 比 特 交替 协议 与 SR 协议 相同 。 

d 当 发 送 方 和 接收 方 窗口 长 度 都 为 1 时 ， 比 特 交替 协议 与 CBN 协议 相同 。 

我 们 曾经 说 过 , 应 用 程序 可 能 选择 UDP 作为 运输 协议 ， 因 为 UDP 提供 了 (H TCP) 更 好 的 应 用 层 

控制 ， 以 决定 在 报 文 段 中 发 送 什么 数据 和 发 送 时 机 。 

a. 应 用 程序 为 什么 对 在 报 文 段 中 发 送 什么 数据 有 更 多 的 控制 ? 

b. 应 用 程序 为 什么 对 何 时 发 送 报 文 段 有 更 多 的 控制 ? 

考虑 从 主机 A 向 主机 B 传输 工 字 节 的 大 文件 ,假设 MSS 为 536 字 节 。 

a. 为 了 使 得 TCP 序号 不 至 于 用 完工 的 最 大 值 是 多 少 ? 前 面 讲 过 TCP 的 序号 字段 为 4 字 节 。 

b. 对 于 你 在 (a) 中 得 到 的 KL， 求 出 传输 此 文件 要 用 多 长 时 间 ? 假定 运输 层 、 网 络 层 和 数据 链 路 层 
首部 总 共 为 66 字 节 ， 并 加 在 每 个 报 文 段 上 ， 然 后 经 155Mbps 链 路 发 送 得 到 的 分 组 。 忽 略 流量 控 
制 和 拥塞 控制 ， 使 主机 A 能 够 一 个 接 一 个 和 连续 不 断 地 发 送 这 些 报 文 段 。 

主机 A 和 B 经 一 条 TCP 连接 通信 ， 并 且 主 机 了 已 经 收 到 了 来 自 A 的 最 长 为 126 字 节 的 所 有 字 节 。 

假定 主机 A 随后 向 主机 B 发 送 两 个 紧 接着 的 报 文 段 。 第 一 个 和 第 二 个 报 文 段 分 别 包含 了 80 字 节 和 

40 字 节 的 数据 。 在 第 一 个 报 文 段 中 ， 序号 是 127， 源 端口 号 是 302， 目 的 地 端口 号 是 80。 无 论 何 时 

主机 B 接收 到 来 自主 机 A 的 报 文 段 ， 它 都 会 发 送 确 认 。 

a. 在 从 主机 A RIE B 的 第 二 个 报 文 段 中 ， 序 号 、 源 端口 号 和 目的 端口 号 各 是 什么 ? 

b 如 果 第 一 个 报 文 段 在 第 二 个 报 文 段 之 前 到 达 ， 在 第 一 个 到 达 报 文 段 的 确认 中 ,确认 号 、 源 端口 号 
和 目的 端口 号 各 是 什么 ? 

c. 如 果 第 二 个 报 文 段 在 第 一 个 报 文 段 之 前 到 达 ， 在 第 一 个 到 达 报 文 段 的 确认 中 ， 确 认 号 是 什么 ? 

d 假定 由 A 发 送 的 两 个 报 文 段 按 序 到 达 B。 第 一 个 确认 丢失 了 而 第 二 个 确认 在 第 一 个 超时 间隔 之 后 
到 达 。 画 出 时 序 图 ， 显 示 这 些 报 文 段 和 发 送 的 所 有 其 他 报 文 段 和 确认 。 (假设 没有 其 他 分 组 丢 
Ko) 对 于 图 上 每 个 报 文 段 ， 标 出 序号 和 数据 的 字 节 数量 ; 对 于 你 增加 的 每 个 应 答 ， 标 出 确认 号 。 

主机 A 和 B 直接 经 一 条 100Mbps 链 路 连接 。 在 这 两 台 主 机 之 间 有 一 条 TCP 连接 。 主 机 A 经 这 条 连 

接 向 主机 B 发 送 一 个 大 文件 。 主 机 A 能 够 向 它 的 TCP 套 接 字 以 高 达 120Mbps 的 速率 发 送 应 用 数据 ， 

而 主机 B 能 够 以 最 大 50Mbps 的 速率 从 它 的 TCP 接收 缓存 中 读 出 数据 。 描 述 TCP 流量 控制 的 影响 。 

在 3.5.6 节 中 讨论 了 SYN cookie, 

a. 服务 器 在 SYNACK 中 使 用 一 个 特殊 的 初始 序号 ， 这 为 什么 是 必要 的 ? 

b. 假定 某 攻击 者 得 知 了 一 台 目 标 主机 使 用 了 SYN cookie。 该 攻击 者 能 够 通过 直接 向 目标 发 送 一 个 
ACK 分 组 创建 半 开 或 全 开 连 接 吗 ? 为 什么 ? 

c. 假设 某 攻 击 者 收集 了 由 服务 器 发 送 的 大 量 初始 序号 。 该 攻击 者 通过 发 送 具有 初始 序号 的 ACK， 能 
够 引起 服务 器 产生 许多 全 开 连 接 吗 ? 为 什么 ? 

考虑 在 3. 6. 1 节 中 显示 在 第 二 种 情况 下 的 网 络 。 假 设 发 送 主机 A 和 B 具有 某 些 固定 的 超时 值 。 

a. 证 明 增 加 路 由 器 有 限 缓存 的 长 度 可 能 减 小 吞吐 量 (Aout) 。 

b. 现在 假设 两 台 主 机 基于 路 由 器 的 缓存 时 延 ， 动 态 地 调整 它们 的 超时 值 ( 像 TCP 所 做 的 那样 ) 。 增 
加 缓存 长 度 将 有 助 于 增加 吞吐 量 吗 ? 为 什么 ? 

假设 测量 的 5 个 SampleRTT 值 (参见 3.5.3 节 ) 是 106ms、120ms、140ms、90ms 和 115ms。 在 获得 

了 每 个 SampleRTT 值 后 计算 EstimatedRTT， 使 用 a = 0. 125 并 且 假 设 在 刚 获得 前 5 个 样本 之 后 Esti- 

matedRTT 的 值 为 100ms。 在 获得 每 个 样本 之 后 ， 也 计算 DevRTT， 假 设 8=0.25， 并 且 假 设 在 刚 获得 

前 5 个 样本 之 后 DevRTT 的 值 为 Sms。 最 后 ， 在 获得 这 些 样本 之 后 计算 TCP TimeoutInterval。 

考虑 TCP 估计 RIT 的 过 程 。 假 设 w =0.1， 令 SampleRT 设置 为 最 新 样本 RTT, 4 SampleRT,, 设置 为 

下 一 个 最 新 样本 RIT， 等 等 。 


P33. 


P34. 
P35, 
P36. 


P37. 


P38. 


P39. 


P40. 


ŽŽ ih & 193 





a 对 于 一 个 给 定 的 TCP 连接 ， 假 定 4 个 确认 报 文 相继 到 达 ， 带 有 4 个 对 应 的 RTT 值 : SampleRT,,, 
SampleRT,, , SampleRT.p 和 SampleRT,, 。 根 据 这 4 个 样本 RTT 表示 EstimatedRTT。 

b. 将 你 得 到 的 公式 一 般 化 到 n 个 RTT 样本 的 情况 。 

ce HFE (b) 中 得 到 的 公式 ， 令 半 趋 于 无 穷 。 试 说 明 为 什么 这 个 平均 过 程 被 称 为 指数 移动 平均 。 

在 3.5.3 节 中 ,我 们 讨论 了 TCP 的 往返 时 间 的 估计 。TCP 避免 测量 重 传 报 文 段 的 SampleRTT， 对 此 

你 有 何 看 法 ? 

3.5.4 节 中 的 变量 SendBase 和 3. 5.5 节 中 的 变量 LastByteRevd 之 间 有 什么 关系 ? 

3.5.5 节 中 的 变量 LastByteRevd 和 3. 5. 4 节 中 的 变量 y 之 间 有 什么 关系 ? 

在 3.5.4 节 中 ， 我 们 看 到 TCP 直到 收 到 3 AR ACK 才 执 行 快速 重 传 。 你 对 TCP 设计 者 没有 选择 

在 收 到 对 报 文 段 的 第 一 个 元 余 ACK 后 就 快速 重 传 有 何 看 法 ? 

比较 GBN、SR 和 TCP (无 延 时 的 ACK) 。 假 设 对 所 有 3 个 协议 的 超时 值 足够 长 ， 使 得 5 个 连续 的 数 

据 报 文 段 及 其 对 应 的 ACK 能 够 分 别 由 接收 主机 (主机 B) 和 发 送 主机 (EHA) KA (如果 在 信 

道中 无 丢失 )。 假 设 主机 A 向 主机 B 发 送 5 个 数据 报 文 段 ， 并 且 第 二 个 报 文 段 (从 A 发送) ER. 

最 后 ， 所 有 5 个 数据 报 文 段 已 经 被 主机 B 正确 接收 。 

a 主机 A 总 共 发 送 了 多 少 报 文 段 和 主机 B 总 共 发 送 了 多 少 ACK? 它们 的 序号 是 什么 ? 对 所 有 3 个 
协议 回答 这 个 问题 。 

b. 如 果 对 所 有 3 个 协议 超时 值 比 5RTT 长 得 多 ， 则 哪个 协议 在 最 短 的 时 间 间 隔 中 成 功 地 交付 所 有 5 
个 数据 报 文 段 ? 

在 图 3-52 中 的 TCP HRP, BII ssthresh 的 值 在 几 个 地 方 被 设置 为 ssthresh = cwnd/2， 并 且 当 出 现 

一 个 丢 包 事件 时 ，ssthresh 的 值 被 设置 为 窗口 长 度 的 一 半 。 当 出 现 丢 包 事件 时 ， 发送 方 发 送 的 速率 ， 

每 个 RIT 必须 大 约 等 于 cwnd 报 文 段 吗 ? 解释 你 的 答案 。 如 果 你 的 回答 是 没有 ; 你 能 建议 一 种 不 同 

的 方式 ， 进 行 ssthresh 设置 吗 ? 

考虑 图 3-46b。 如 果 和 ,增加 超过 了 R/2, A 能够 增加 超过 R/S 吗 ? 试 解释 之 。 现 在 考虑 图 3-46c。 

假定 一 个 分 组 从 路 由 器 到 接收 方 平 均 转 发 两 45 

次 的 话 ， 如 果 人 增加 超过 RV2， 和 ,能够 增加 

超过 R/4 吗 ? 试 解释 之 。 

考虑 图 3-58。 假 设 TCP Reno 是 一 个 经 历 如 上 

所 示 行 为 的 协议 ， 回 答 下 列 问 题 。 在 各 种 情 

况 中 ， 简 要 地 论证 你 的 回答 。 

a. 指出 TCP 慢 启动 运行 时 的 时 间 间 隔 。 

b. 指出 TCP 拥塞 避免 运行 时 的 时 间 间 隔 。 

c. 在 第 16 个 传输 轮回 之 后 ， 报 文 段 的 丢失 是 
根据 3 TTR ACK 还 是 根据 超时 检测 出 “ 
来 的 ? - 下 

d. 在 第 22 个 传输 轮回 之 后 ， 报 文 段 的 丢失 是 传输 轮回 
根据 3 个 元 余 ACK 还 是 根据 超时 检测 出 
来 的 ? 图 3-58 TCP 窗口 长 度 作为 时 间 的 函数 

e. 在 第 1 个 传输 轮回 里 ，ssthresh 的 初始 值 设置 为 多 少 ? 

f 在 第 18 个 传输 轮回 里 ，ssthresh 的 值 设置 为 多 少 ? 

g. 在 第 24 个 传输 轮回 里 ，ssthresh 的 值 设置 为 多 少 ? 

h. 在 哪个 传输 轮回 内 发 送 第 70 个 报 文 段 ? 

i 假定 在 第 26 个 传输 轮回 后 ， 通 过 收 到 3 PIR ACK 检测 出 有 分 组 丢失 ,拥塞 的 窗口 长 度 和 
ssthresh 的 值 应 当 是 多 少 ? 

j. 假定 使 用 TCP Tahoe (而 不 是 TCP Reno) ， 并 假定 在 第 16 个 传输 轮回 收 到 3 ATA ACK, FESS 19 
个 传输 轮回 ，ssthresh 和 拥塞 窗口 长 度 是 什么 ? 


asi 





拥塞 窗口 长 度 〈 报 文 段 ) 


5 





194 £3¢ 


P41. 


P42. 


P43. 


P44. 


P45. 


P46. 


P47. 


P48. 


P49. 


P50. 


k. 再 次 假设 使 用 TCP Tahoe， 在 第 22 个 传输 轮回 有 一 个 超时 事件 。 从 第 17 个 传输 轮回 到 第 22 个 传 
输 轮 回 〈 包 括 这 两 个 传输 轮回 ) ， 一 共 发 送 了 多 少 分 组 ? 

参考 图 3-55 ， 该 图 描述 了 TCP 的 AIMD 算法 的 收敛 特性 。 假 设 TCP 不 采用 乘 性 减 ， 而 是 采用 按 某 一 

常量 减 小 窗口 。 所 得 的 AIAD 算法 将 收敛 于 一 种 平等 共享 算法 吗 ? 使 用 类 似 于 图 3-55 中 的 图 来 证 实 

你 的 结论 。 

在 3.5.4 节 中 ， 我 们 讨论 了 在 发 生 超 时 事件 后 将 超时 间隔 加 倍 。 为 什么 除了 这 种 加 倍 超时 间隔 机 制 

外 ，TCP 还 需要 基于 窗口 的 拥塞 控制 机 制 (如 在 3.7 节 中 学 习 的 那 种 机 制 ) 呢 ? 

主机 A 通过 一 条 TCP 连接 向 主机 B 发 送 一 个 很 大 的 文件 。 在 这 条 连接 上 ， 不 会 出 现任 何 分 组 丢失 和 

定时 器 超时 。 主 机 A 与 因特网 连接 链 路 的 传输 速率 表示 为 Rbps。 假 设 主机 A 上 的 进程 能 够 以 $ bps 

的 速率 向 TCP 套 接 字 发 送 数据 ， 其 中 $ = 10 xR。 进 一 步 假设 TCP 的 接收 缓存 足够 大 能够 容纳 整 

个 文件 ， 并 且 发 送 缓存 只 能 容纳 这 个 文件 的 百 分 之 一 。 如 何 防止 主机 A 上 的 进程 连续 地 向 TCP 套 接 

FURR S bps 传送 数据 呢 ? 还 是 用 TCP 流量 控制 呢 ? 还 是 用 TCP 拥塞 控制 ? 或 者 用 其 他 措施 ? I 

述 其 理由 。 

考虑 从 一 台 主 机 经 一 条 没有 丢 包 的 TCP 连接 向 另 一 台 主 机 发 送 一 个 大 文件 。 

a. 假定 TCP 使 用 不 具有 慢 启动 的 AIMD 进行 拥塞 控制 。 假 设 每 当 收 到 一 批 ACK 时 ，cwnd 增加 1 个 
MSS， 并 且 假 设 往返 时 间 大 约 恒 定 ，cwnd 从 6MSS 增加 到 12MSS 要 花费 多 长 时 间 (假设 没有 丢 包 
事件 )? 

b. 对 于 该 连接 ， 到 时 间 =6RTT， 其 平均 吞吐 量 是 多 少 (根据 MSS 和 RTT)? 

回想 TCP 吞吐 量 的 宏观 描述 。 在 连接 速率 从 W/(2x RIT) 变化 到 WRT 的 周期 内 ， 只 丢失 了 一 个 

分 组 (在 该 周期 的 结束 ) 。 

a. 证 明 其 丢 包 率 (分 组 丢失 的 比率 ) SF: 

l 


L= $4% = 一 一 一 一 
E 
a 
b. 如 果 一 条 连接 的 丢 包 率 为 L， 使 用 上 面 的 结果 ， 则 它 的 平均 速率 近似 由 下 式 给 出 : 
SS 
thee RIT JL 


考虑 仅 有 一 条 单一 的 TCP (Reno) 连接 使 用 一 条 10Mbps 链 路 ， 且 该 链 路 没有 缓存 任何 数据 。 假 设 
这 条 链 路 是 发 送 主机 和 接收 主机 之 间 的 唯一 拥塞 链 路 。 假 定 某 TCP 发 送 方向 接收 方 有 一 个 大 文件 要 
发 送 ， 而 接收 方 的 接收 缓存 比 拥塞 窗口 要 大 得 多 。 我 们 也 做 下 列 假设 : 每 个 TCP 报 文 段 长 度 为 1500 
字 节 ; 该 连接 的 双向 传播 时 延 是 150ms; 并 且 该 TCP 连接 总 是 处 于 拥塞 避免 阶段 ， 即 忽略 了 慢 
启动 。 

a. 这 条 TCP 连接 能 够 取得 的 最 大 窗口 长 度 ( 以 报 文 段 计 ) 是 多 少 ? 

b. 这 条 TCP 连接 的 平均 窗口 长 度 (以 报 文 段 计 ) 和 平均 吞吐 量 (以 bps 计 ) 是 多 少 ? 

c 这 条 TO 连接 在 从 丢 包 恢 复 后 ， 再 次 到 达 其 最 大 窗口 要 经 历 多 长 时 间 ? 

考虑 在 前 面 习题 中 所 描述 的 场景 。 假 设 10Mbps 链 路 能 够 缓存 有 限 个 报 文 段 。 试 论证 为 了 使 该 链 路 
总 是 忙于 发 送 数据 ， 我 们 将 要 选择 缓存 长 度 ， 使 得 其 至 少 为 发 送 方 和 接收 方 之 间 链 路 速率 C 与 双向 
传播 时 延 之 积 。 

重复 习题 46 ， 但 用 一 条 10Gbps 链 路 代替 10Mbps 链 路 。 注 意 到 在 对 部 分 的 答案 中 ,应 当 认识 到 在 
从 丢 包 恢复 后 ， 拥 塞 窗口 长 度 到 达 最 大 窗口 长 度 将 需要 很 长 时 间 。 给 出 解决 该 问题 的 基本 思路 。 

令 T (用 RIT 度 量 ) 表示 一 条 TCP 连接 将 拥塞 窗口 从 W/2 增加 到 丈 所 需 的 时 间 间 隔 ， 其 中 WW 是 最 
大 的 拥塞 窗口 长 度 。 论 证 了 是 TCP 平均 吞吐 量 的 函数 。 

考虑 一 种 简化 的 TCP 的 AIMD 算法 ， 其 中 拥塞 窗口 长 度 用 报 文 段 的 数量 来 度量 ， 而 不 是 用 字 节 度 
量 。 在 加 性 增 中 ， 每 个 RTT 拥塞 窗口 长 度 增加 一 个 报 文 段 。 在 乘 性 减 中 ， 拥 塞 窗口 长 度 减 小 一 半 
(如 果 结 果 不 是 一 个 整数 ， 向 下 取 整 到 最 近 的 整数 ) 。 假 设 两 条 TCP 连接 Cl 和 C2， 它 们 共享 一 条 速 
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率 为 每 秒 30 个 报 文 段 的 单一 拥塞 链 路 。 假设 Cl 和 C2 均 处 于 拥塞 避免 阶段 。 连 接 Cl 的 RIT 是 
50ms， 连 接 C2 的 RTT 是 100ms。 假 设 当 链 路 中 的 数据 速率 超过 了 链 路 的 速率 时 ， 所 有 TCP 连接 经 
受 数 据 报 文 段 丢失 。 

a. 如 果 在 时 刻 t。，C1l 和 C2 具有 10 个 报 文 段 的 拥塞 窗口 ， 在 1000ms 后 它们 的 拥塞 窗口 为 多 长 ? 

b 经 长 时 间 运 行 ， 这 两 条 连接 将 取得 共享 该 拥塞 链 路 的 相同 的 带宽 吗 ? 

P51. 考虑 在 前 面 习题 中 描述 的 网 络 。 现 在 假设 两 条 TCP 连接 Cl 和 C2 ， 它 们 具有 相同 的 100ms RTT。 假 
BENZ to, C 的 拥塞 窗口 长 度 为 15 个 报 文 段 ， 而 C2 的 拥塞 窗口 长 度 是 10 个 报 文 段 。 

a. 在 2200ms 后 ， 它 们 的 拥塞 窗口 长 度 为 多 长 ? 

b 经 长 时 间 运 行 ， 这 两 条 连接 将 取得 共享 该 拥塞 链 路 的 相同 的 带宽 吗 ? 

c 如 果 这 两 条 连接 在 相同 时 间 达 到 它们 的 最 大 窗口 长 度 ， 并 在 相同 时 间 达 到 它们 的 最 小 窗口 长 度 ， 
我 们 说 这 两 条 连接 是 同步 的 。 经 长 时 间 运 行 ， 这 两 条 连接 将 最 终 变 得 同步 吗 ? 如 果 是 ， 它 们 的 最 
大 窗口 长 度 是 多 少 ? 

d 这 种 同步 将 有 助 于 改善 共享 链 路 的 利用 率 吗 ? 为 什么 ? 给 出 打破 这 种 同步 的 某 种 思路 。 

P52. 考虑 修改 TCP 的 拥塞 控制 算法 。 不 使 用 加 性 增 , 使 用 乘 性 增 。 无论 何 时 某 TCP 收 到 一 个 合法 的 
ACK， 就 将 其 窗口 长 度 增 加 一 个 小 正 数 a (0 <a<1) 。 求 出 丢 包 率 工 和 最 大 拥塞 窗口 克之 间 的 函数 
关系 。 论证; 对 于 这 种 修正 的 TCP， 无 论 TCP 的 平均 吞吐 量 如 何 ， 一 条 TCP 连接 将 其 拥塞 窗口 长 度 
从 W/2 增加 到 歼 ， 总 是 需要 相同 的 时 间 。 

P53. 在 3.7 节 对 TCP 未 来 的 讨论 中 ,我们 注意 到 为 了 取得 10Gbps HAEE, TCP 仅 能 容忍 2 x 10- AER 
文 段 丢失 率 (或 等 价 为 每 5 000 000 000 个 报 文 段 有 一 个 丢 包 事件 )。 给 出 针对 3.7 节 中 给 定 的 RIT 
和 MSS 值 的 对 2 x 10-" 值 的 推导 。 如 果 TCP 需要 支持 一 条 100Gbps 的 连接 ， 所 能 容忍 的 丢 包 率 
是 多 少 ? 

P54. 在 3.7 节 中 对 TCP 拥塞 控制 的 讨论 中 ， 我 们 隐 含 地 假定 TCP 发 送 方 总 是 有 数据 要 发 送 。 现 在 考虑 下 
列 情况 ， 某 TCP 发 送 方 发 送 大 量 数据 ， 然 后 在 时 刻 变 得 空闲 〈 因 为 它 没有 更 多 的 数据 要 发 送 ) 。 
TCP 在 相对 长 的 时 间 内 保持 空闲 ， 然 后 在 妃 时 刻 要 发 送 更 多 的 数据 。 当 TCP 在 开始 发 送 数据 时 ， 
让 它 使 用 在 所 时 刻 的 cwnd 和 ssthresh 值 ， 将 有 什么 样 的 优点 和 缺点 ? 你 建议 使 用 什么 样 的 方法 ? 为 
什么 ? : 

P55. 在 这 个 习题 中 我 们 研究 是 否 UDP ak TCP 提供 了 某 种 程度 的 端点 鉴别 。 

a. 考虑 一 台 服 务 器 接收 到 在 一 个 UDP 分 组 中 的 请 求 并 对 该 请 求 进行 响应 (例如 ， 如 由 DNS 服务 器 
所 做 的 那样 )。 如 果 一 个 具有 IP 地址 X 的 客户 用 地 址 Y 进行 哄骗 的 话 ， 服 务 器 将 向 何 处 发 送 它 
的 响应 ? 

b. 假定 一 台 服 务 器 接收 到 具有 IP bhk Y 的 一 个 SYN， 在 用 SYNACK 响应 之 后 ， 接 收 一 个 具有 IP 
源 地 址 Y 和 正确 确认 号 的 ACK, 假设 该 服务 器 选择 了 一 个 随机 初始 序号 并 且 没 有 “中 间 人 ”， 该 
服务 器 能 够 确定 该 客户 的 确 位 于 Y 吗 ? (并 且 不 在 某 个 其 他 哄骗 为 Y 的 地 址 X。) 

P56. 在 这 个 习题 中 ， 我 们 考虑 由 TCP 慢 启 动 阶段 引入 的 时 延 。 考 虑 一 个 客户 和 一 个 Web 服务 器 直接 连 
RIAR R 的 一 条 链 路 。 假 定 该 客户 要 取 回 一 个 对 象 ， 其 长 度 正好 等 于 155， 其 中 5 是 最 大 段 长 度 
(MSS) 。 客 户 和 服务 器 之 间 的 往返 时 间 表 示 为 RTT (假设 为 常数 )。 忽 略 协议 首部 ， 确 定 在 下 列 情 
况 下 取 回 该 对 象 的 时 间 (包括 TCP 连接 创建 ) : 

a. 4S/R > S/R+RTT >2S/R 

b. S/R + RTT >4S/R 

c. S/R > RTT 


4 编程 作业 


实现 一 个 可 靠 运输 协议 
在 这 个 编程 作业 实验 中 ， 你 将 要 编写 发 送 和 接收 运输 层 的 代码 ， 以 实现 一 个 简单 的 可 靠 数 据 运 输 协 
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议 。 这 个 实验 有 两 个 版 本 ， 即 比特 交替 协议 版 本 和 CBN 版 本 。 这 个 实验 应 当 是 有 趣 的 ， 因 为 你 的 实现 将 
与 实际 情况 下 所 要 求 的 差异 很 小 。 

因为 可 能 没有 你 能 够 修改 其 操作 系统 的 独立 机 器 ， 你 的 代码 将 不 得 不 在 模拟 的 硬件 /软件 环境 中 执行 。 
然而 ， 为 你 提供 例 程 的 编程 接口 〈 即 从 上 层 和 下 层 调用 你 的 实体 的 代码 ) ， 非 常 类 似 于 在 实际 UNIX 环境 中 
做 那些 事情 的 接口 。 (实际 上 ， 在 本 编程 作业 中 描述 的 软件 接口 比 起 许多 教科 书 中 描述 的 无 限 循环 的 发 送 
方 和 接收 方 要 真实 得 多 。) 停止 和 启动 定时 器 也 是 模拟 的 ， 定 时 器 中 断 将 激活 你 的 定时 器 处 理 例 程 。 

这 个 完整 的 实验 作业 以 及 你 所 需要 的 代码 ， 可 从 本 书 的 Web 网 站 上 获得 : http://www. pearsonhigh- 


ered. com/cs- resources, 


图 | Wireshark 实验 : 探究 TCP 


在 这 个 实验 中 ， 你 将 使 用 Web 浏览 器 访问 来 自 某 Web 服务 器 的 一 个 文件 。 如 同 在 前 面 的 Wireshark 
实验 中 一 样 ， 你 将 使 用 Wireshark 来 俘获 到 达 你 计算 机 的 分 组 。 与 前 面 实验 不 同 的 是 ， 你 也 能 够 从 该 Web 
服务 器 下 载 一 个 Wireshark 可 读 的 分 组 踪迹 ， 记 载 你 从 服务 器 下 载 文件 的 过 程 。 在 这 个 服务 器 踪迹 文件 
里 ， 你 将 发 现 自己 访问 该 Web 服务 器 所 产生 的 分 组 。 你 将 分 析 客 户 端 和 服务 器 端 踪迹 文件 ， 以 探究 TCP 
的 方方面面 。 特 别 是 你 将 评估 在 你 的 计算 机 与 该 Web 服务 器 之 间 TCP 连接 的 性 能 。 你 将 跟踪 TCP 窗口 行 
为 、 推 断 分 组 丢失 、 重 传 、 流 控 和 拥塞 控制 行为 并 估计 往返 时 间 。 

与 所 有 的 Wireshark 实验 一 样 ， 该 实验 的 全 面 描 述 能 够 在 本 书 Web 站 点 http://www. pearsonhighered. 
com/ cs-resources 上 找到 。 


P|] Wireshark 实验 : 探究 UDP 


在 这 个 简短 实验 中 ， 你 将 进行 分 组 俘获 并 分 析 那 些 使 用 UDP 的 你 喜爱 的 应 用 程序 (例如 ，DNS 或 如 
Skype 这 样 的 多 媒体 应 用 ) 。 如 我 们 在 3. 3 节 中 所 学 的 那样 ，UDP 是 一 种 简单 的 、 不 提供 不 必要 服务 的 运 
输 协 议 。 在 这 个 实验 中 ， 你 将 研究 在 UDP 报 文 段 中 的 各 首部 字段 以 及 检验 和 计算 。 

与 所 有 的 Wireshark 实验 一 样 ， 该 实验 的 全 面 描述 能 够 在 本 书 Web 站 点 http://www. pearsonhigh- 
ered. com/cs-resources 上 找到 。 
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获得 IEEE Kobayashi 奖 。 他 于 2004 年 当选 为 美国 国家 工程 院 院士 。 











。 请 描述 您 职业 生涯 中 做 过 的 一 两 个 最 令 人 激动 的 项 目 。 最 大 的 挑战 是 Van Jacobson 

什么 ? 

学 校 教会 我 们 许多 寻找 答案 的 方式 。 在 每 个 我 致力 于 的 感 兴趣 的 问题 中 ,艰巨 的 任务 是 找到 正确 的 
问题 。 当 Mike Karels 和 我 开始 关注 TCP 拥塞 时 ,我们 花费 数 月 凝视 协议 和 分 组 踪迹 ， 询问 “为 什么 它 会 
失效 ?”。 有 一 天 在 Mike 的 办 公 室 ， 我 们 中 的 一 个 说 : “我 无 法 和 弄 明白 它 失 效 的 原因 是 因为 我 不 理解 它 究 
竟 如 何 开 始 运 转 的 。” 这 导致 提出 了 一 个 正确 问题 ， 它 迫使 我 们 弄 明 白 使 TCP 运转 的 “ack 计时 ”。 从 那 
以 后 ， 其 他 东西 就 容易 了 。 

© 从 更 为 一 般 的 意义 上 讲 ， 您 认为 网 络 和 因特网 未 来 将 往 何 处 发 展 ? 

对 于 大 多 数 人 来 说 ，Web 是 因特网 。 对 此 ， 网 络 奇才 们 将 会 善意 地 窃 笑 ， 因 为 我 们 知道 Web 是 一 个 
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运行 在 因特网 上 的 应 用 程序 ， 但 要 是 以 上 说 法 正确 又 该 如 何 呢 ? 因特网 使 得 主机 对 之 间 能 够 进行 交谈 。 
Web 用 于 分 布 信息 的 生产 和 消耗 “信息 传播 ”是 一 种 非常 一 般 意义 上 的 通信 ， 而 “成 对 交谈 ”只 是 其 
中 一 个 极 小 的 子 集 。 我 们 需要 向 更 大 的 范围 进发 。 今 天 的 网 络 以 点 到 点 连 线 的 方式 处 理 广播 媒体 (无 线 
电 、PON 等 ) 。 那 是 极为 低 效 的 。 经 过 指头 融 击 或 智能 手机 ， 遍 及 全 世界 的 每 秒 兆 兆 (10°) 比特 的 数据 
正在 交换 ， 但 我 们 不 知道 如 何 将 其 作为 “网 络 ”处 理 。ISP 正在 忙于 建立 缓存 和 CDN， 以 可 扩展 地 分 发 
视频 和 音频 。 缓 存 是 该 解决 方案 的 必要 部 分 ， 但 今天 的 网 络 缺 乏 这 个 部 分 。 从 信息 论 、 排 队 论 或 流量 理 
论 直 到 因特网 协议 规范 ， 都 告诉 我 们 如 何 建造 和 部 署 它 。 我 认为 并 希望 在 未 来 几 年 中 ， 网 络 将 演化 为 包 
含 多 得 多 的 通信 愿景， 支撑 Web 的 运行 。 

。 是 谁 激发 了 您 的 职业 灵感 ? 

当 我 还 在 研究 生 院 时 ，Richard Feynman 访问 了 学 校 并 做 了 学 术 报 告 。 他 讲 到 了 一 些 量子 理论 知识 ， 
使 我 整 学 期 都 在 努力 理解 该 理论 ， 他 的 解释 非常 简单 和 明白 易 懂 ， 使 得 那些 对 我 而 言 难以 理解 的 东西 变 
得 显而易见 和 不 可 避免 。 领 会 和 表达 复杂 世界 背后 的 简单 性 的 能 力 是 给 我 的 罕见 和 绝妙 的 礼物 。 

。 您 对 进入 计算 机 科学 和 网 络 领 域 的 学 生 有 什么 忠告 吗 ? 

网 络 是 奇妙 的 领域 ， 计 算 机 和 网 络 对 社会 的 影响 ， 也 许 比 自 有 文字 记载 以 来 的 任何 发 明 都 大 。 网 络 
本 质 上 是 有 关连 接 的 东西 ， 研 究 它 有 助 于 你 进行 智能 连接 : 蚁 群 搜索 和 蜜蜂 舞蹈 显示 了 协议 设计 好 于 
RFC， 流 量 拥挤 或 人 们 离开 挤 满 人 的 体育 馆 是 拥塞 的 要 素 ， 在 感恩 节 暴 风 雪 后 寻找 航班 返回 学 校 的 学 生 
们 是 动态 路 由 选择 的 核心 。 如 果 你 对 许多 东西 感 兴趣 ， 并 且 要 对 此 干 点 事 ， 很 难 想象 还 有 什么 比 网 络 更 
好 的 领域 了 。 
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在 前 一 章 中 我 们 学 习 了 运输 层 依赖 于 网 络 层 的 主机 到 主机 的 通信 服务 ， 提 供 各 种 形式 
的 进程 到 进程 的 通信 。 我 们 也 学 习 了 运输 层 工 作 时 不 具备 任何 有 关 网 络 层 实际 实现 这 种 服 
务 的 知识 。 因 此 也 许 你 现在 想 知道 ， 这 种 主机 到 主机 通信 服务 的 真实 情况 是 什么 ?是 什么 
使 得 它 工作 起 来 的 呢 ? 

在 本 章 和 下 一 章 中 ， 我 们 将 学 习 网 络 层 实际 是 怎样 实现 主机 到 主机 的 通信 服务 的 。 我 
们 将 看 到 与 运输 层 和 应 用 层 不 同 的 是 ， 在 网 络 中 的 每 一 台 主 机 和 路 由 器 中 都 有 一 个 网 络 层 
部 分 。 正 因 如 此 ， 网 络 层 协议 是 协议 栈 中 最 具 挑 战 性 〈 因 而 也 是 最 有 趣 ) 的 部 分 。 

网 络 层 在 协议 栈 中 毋庸 置疑 是 最 复杂 的 层次 ， 因 此 我 们 将 在 这 里 用 大 量 篇 幅 来 讨论 。 
的 确 因为 涉及 的 内 容 太 多 ， 我们 要 用 两 章 的 篇 幅 来 讨论 网 络 层 。 我 们 将 看 到 网 络 层 能 够 被 
分 解 为 两 个 相互 作用 的 部 分 ， 即 数据 平面 和 控制 平面 。 在 第 4 章 ， 我们 将 首先 学 习 网 络 层 
的 数据 平面 功能 ， 即 网 络 层 中 每 台 路 由 器 的 功能 ， 该 数据 平面 功能 决定 到 达 路 由 器 输入 链 
路 之 一 的 数据 报 〈 即 网 络 层 的 分 组 ) 如 何 转发 到 该 路 由 器 的 输出 链 路 之 一 。 我 们 将 涉及 传 
统 的 下 转发 〈 其 中 转发 基于 数据 报 的 目的 地 址 ) 和 通用 的 转发 (其 中 可 以 使 用 数据 报 首 
部 中 的 几 个 不 同 域 的 值 执行 转发 和 其 他 功能 ) 。 我 们 将 详细 地 学 习 IPv4 和 IPv6 协议 及 其 寻 
址 。 在 第 5 章 , 我 们 将 涉及 网 络 层 的 控制 平面 功能 ， 即 网 络 范围 的 逻辑 ， 该 控制 平面 功能 
控制 数据 报 沿 着 从 源 主机 到 目的 主机 的 端 到 端 路 径 中 路 由 器 之 间 的 路 由 方式 。 我 们 将 学 习 
路 由 选择 算法 ， 以 及 广泛 用 于 今天 因特网 中 的 诸如 OSPF 和 BCP 等 路 由 选择 协议 。 传 统 
上 ， 这 些 控制 平面 路 由 选择 协议 和 数据 平面 转发 功能 已 被 实现 成 一 个 整体 ， 位 于 一 台 路 由 
器 中 。 软 件 定 义 网 络 ( Software- Defined Networking, SDN) 通过 将 这 些 控制 平面 功能 作为 
一 种 单独 服务 ， 明 确 地 分 离 数据 平面 和 控制 平面 ， 控 制 平面 功能 通常 置 于 一 台 远程 “控制 
器 ”中 。 我 们 将 在 第 5 章 涉及 SDN 控制 器 。 

网 络 层 中 数据 平面 和 控制 平面 之 间 的 功能 区 别 很 重要 ， 当 你 学 习 网 络 层 时 ， 心 中 要 
记 住 这 个 区 别 。 它 将 有 助 于 你 构思 网 络 层 ， 并 且 反 映 计算 机 网 络 中 网 络 层 角色 的 现代 
观点 。 


4.1 网 络 层 概述 


图 4-1 显示 了 一 个 简单 网 络 ， 其 中 有 Hl 和 H2 两 台 主机 ,在 Hl 与 H2 之 间 的 路 径 上 
有 几 台 路 由 器 。 假 设 Hl 正在 向 H2 发 送信 息 ， 考 虑 这 些 主机 与 中 间 路 由 器 的 网 络 层 所 起 
RIVERA. H 中 的 网 络 层 取得 来 自 于 H 运输 层 的 报 文 段 ， 将 每 个 报 文 段 封 装 成 一 个 数据 
报 ， 然 后 向 相 邻 路 由 器 RI 发 送 该 数据 报 。 在 接收 方 主机 H2 ， 网 络 层 接收 来 自 相 邻 路 由 器 
R2 的 数据 报 ， 提 取出 运输 层 报 文 段 ， 并 将 其 向 上 交付 给 H2 的 运输 层 。 每 台 路 由 器 的 数据 
平面 的 主要 作用 是 从 其 输入 链 路 向 其 输出 链 路 转发 数据 报 ; 控制 平面 的 主要 作用 是 协调 这 
些 本 地 的 每 路 由 器 转发 动作 ， 使 得 数据 报 沿 着 源 和 目的 地 主机 之 间 的 路 由 器 路 径 最 终 进 行 
端 到 端 传送 。 注 意 到 图 4-1 中 所 示 路 由 器 具有 截断 的 协议 栈 ， 即 没有 网 络 层 以 上 的 部 分 ， 
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因为 路 由 器 不 运行 我 们 已 在 第 2、3 章 学 习 过 的 应 用 层 和 运输 层 协议 。 
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图 4-1 网 络 层 


.1 转发 和 路 由 选择 : 数据 平面 和 控制 平面 
网 络 层 的 作用 从 表面 上 看 极为 简单 ， 即 将 分 组 从 一 台 发 送 主机 移动 到 一 台 接 收 主机 。 


为 此 ， 需 要 使 用 两 种 重要 的 网 络 层 功能 : 


。 转发 。 当 一 个 分 组 到 达 某 路 由 器 的 一 条 输入 链 路 时 ， 该 路 由 器 必须 将 该 分 组 移动 
到 适当 的 输出 链 路 。 例 如 ， 在 图 4-1 中 来 自主 机 HI 到 路 由 器 RI 的 一 个 分 组 ， 必 
须 向 到 达 H2 的 路 径 上 的 下 一 台 路 由 器 转发 。 如 我 们 将 看 到 的 那样 ， 转 发 是 在 数据 
平面 中 实现 的 唯一 功能 〈 尽 管 是 最 为 常见 和 重要 的 功能 ) 。 在 最 为 常见 的 场合 
(我 们 将 在 4. 4 节 中 讨论 ) ， 分 组 也 可 能 被 现 有 的 路 由 器 阻挡 〈 例 如 ， 该 分 组 来 源 
于 一 个 已 知 的 恶意 主机 ， 或 者 该 分 组 发 向 一 个 被 禁止 的 目的 主机 ) ， 或 者 可 能 是 元 
余 的 并 经 过 多 条 出 链 路 发 送 。 
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© 路 由 选择 。 当 分 组 从 发 送 方 流向 接收 方 时 ， 网 络 层 必须 决定 这 些 分 组 所 采用 的 路 
由 或 路 径 。 计 算 这 些 路 径 的 算法 被 称 为 路 由 选择 算法 (routing algorithm ) 。 例 如 ， 
在 图 4-1 中 一 个 路 由 选择 算法 将 决定 分 组 从 Hl 到 H2 流动 所 遵循 的 路 径 。 路 由 选 
择 在 网 络 层 的 控制 平面 中 实现 。 
在 讨论 网 络 层 时 ， 许 多 作者 经 常 交替 使 用 转发 和 路 由 选择 这 两 个 术语 。 我 们 在 本 书 中 
将 更 为 精确 地 使 用 这 些 术语 。 转 发 (forwarding) 是 指 将 分 组 从 一 个 输入 链 路 接口 转移 到 
适当 的 输出 链 路 接口 的 路 由 器 本 地 动作 。 转 发 发 生 的 时 间 尺 度 很 短 (通常 为 几 纳 秒 ) ， 因 
此 通常 用 硬件 来 实现 。 路 由 选择 (routing) 是 指 确定 分 组 从 源 到 目的 地 所 采取 的 端 到 端 路 
径 的 网 络 范围 处 理 过 程 。 路 由 选择 发 生 的 时 间 尺 度 长 得 多 〈 通 常 为 几 秒 ) ， 因 此 通常 用 软 
件 来 实现 。 用 驾驶 的 例子 进行 类 比 ， 考 虑 在 1. 3. 1 节 中 旅行 者 所 历经 的 从 宾夕法尼亚 州 到 
佛罗里达 州 的 行程 。 在 这 个 行程 中 ， 那 位 驾驶 员 在 到 佛罗里达 州 的 途中 经 过 了 许多 立交 
桥 。 我 们 能 够 认为 转发 就 像 通 过 单个 立交 桥 的 过 程 : 一 辆 汽车 从 其 道路 上 进入 立交 桥 的 一 
个 入 口 ， 并 且 决 定 应 当 走 哪 条 路 来 离开 该 立交 桥 。 我 们 可 以 把 路 由 选择 看 作 是 规划 从 宾 夕 
法 尼 亚 州 到 佛罗里达 州 行程 的 过 程 : 在 着 手 行程 之 前 ,驾驶 员 已 经 查阅 了 地 图 并 在 许多 可 
能 的 路 径 中 选择 一 条 ， 其 中 每 条 路 径 都 由 一 系列 经 立交 桥 连 接 的 路 段 组 成 。 
每 台 网 络 路 由 器 中 有 一 个 关键 元 素 是 它 的 转发 表 (forwarding table) 。 路 由 器 检查 到 达 
分 组 首部 的 一 个 或 多 个 字段 值 ， 进 而 使 用 这 些 首部 值 在 其 转发 表 中 索引 ， 通 过 这 种 方法 来 
转发 分 组 。 这 些 值 对 应 存储 在 转发 表 项 中 的 值 ， 指 出 了 该 分 组 将 被 转发 的 路 由 器 的 输出 链 
路 接口 。 例 如 在 图 4-2 中 ， 一 个 首部 字段 值 为 0111 的 分 组 到 达 路 由 器 。 该 路 由 器 在 它 的 
转发 表 中 索引 ， 并 确定 该 分 组 的 输出 链 路 接口 是 接口 2。 该 路 由 器 则 在 内 部 将 该 分 组 转发 
到 接口 2。 在 4.2 节 中 ， 我们 深入 路 由 器 内 部 ， 更 为 详细 地 研究 这 种 转发 功能 。 转 发 是 由 
网 络 层 的 数据 平面 执行 的 主要 功能 。 
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图 4-2 路 由 选择 算法 决定 转发 表 中 的 值 
1. 控制 平面 : 传统 的 方法 
你 也 许 现在 想 知 道路 由 器 中 的 转发 表 一 开始 是 如 何 配 置 的 。 这 是 一 个 关键 问题 ， 它 揭 
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示 了 路 由 选择 和 转发 间 的 重要 相互 作用 关系 。 如 图 4-2 所 示 ， 路 由 选择 算法 决定 了 插入 该 
路 由 器 转发 表 的 内 容 。 在 这 个 例子 中 ， 路 由 选择 算法 运行 在 每 台 路 由 器 中 ， 并 且 在 每 台 路 
由 器 中 都 包含 转发 和 路 由 选择 两 种 功能 。 如 我 们 将 在 5.3 节 和 5. 4 节 中 所 见 ， 在 一 台 路 由 
器 中 的 路 由 选择 算法 与 在 其 他 路 由 器 中 的 路 由 选择 算法 通信 ， 以 计算 出 它 的 转发 表 的 值 。 
这 种 通信 是 如 何 执行 的 呢 ? 通过 根据 路 由 选择 协议 交换 包含 路 由 选择 信息 的 路 由 选择 报 
X! 我 们 将 在 5.2 ~5.4 节 讨论 路 由 选择 算法 和 协议 。 

通过 考虑 网 络 中 的 假想 情况 (不 真实 的 ,但 技术 上 是 可 行 的) ， 也 就 是 说 路 由 器 中 物 
理 上 存在 的 所 有 转发 表 的 内 容 是 由 人 类 网 络 操 作 员 直接 配置 的 ， 进 一 步 说 明 转 发 和 路 由 选 
择 功能 的 区 别 和 不 同 目的 。 在 这 种 情况 下 ， 不 需要 任何 路 由 选择 协议 ! 当然 ， 这 些 人 类 操 
作 员 将 需要 彼此 交互 ， 以 确保 该 转发 表 的 配置 能 使 分 组 到 达 它 们 想 要 到 达 的 目的 地 。 出 现 
下 列 现象 也 很 可 能 : 人工 配 置 更 容易 出 错 ， 并 且 对 于 网 络 拓扑 变化 的 响应 比 起 路 由 选择 协 
议 来 更 慢 。 我 们 要 为 所 有 网 络 具 有 转发 和 路 由 选择 功能 而 感到 幸运 ! 

2. 控制 平面 : SDN 方法 

图 4-2 中 显示 的 实现 路 由 选择 功能 的 方法 ， 是 路 由 选择 厂商 在 其 产品 中 采用 的 传统 方 
法 ,至 少 最 近 还 是 如 此 。 使 用 该 方法 ， 每 台 路 由 器 都 有 一 个 与 其 他 路 由 器 的 路 由 选择 组 件 
通信 的 路 由 选择 组 件 。 然 而 ， 对 人 类 能 够 手动 配置 转发 表 的 观察 启发 我 们 ， 对 于 控制 平面 
功能 来 说 ， 也 许 存在 其 他 方式 来 确定 数据 平面 转发 表 的 内 容 。 

图 4-3 显示 了 从 路 由 器 物理 上 分 离 的 另 一 种 方法 ， 远 程控 制 器 计算 和 分 发 转发 表 以 供 
每 台 路 由 器 所 使 用 。 注 意 到 图 4-2 和 图 4-3 的 数据 平面 组 件 是 相同 的 。 而 在 图 4-3 中 ， 控 
制 平面 路 由 选择 功能 与 物理 的 路 由 器 是 分 离 的 ， 即 路 由 选择 设备 仅 执行 转发 ， 而 远程 控制 


a 








F4-3 “远程 控制 器 确定 并 分 发 转发 表 中 的 值 
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器 计算 并 分 发 转发 表 。 远 程控 制 器 可 能 实现 在 具有 高 可 靠 性 和 宛 余 的 远程 数据 中 心中 ， 并 
可 能 由 ISP 或 某 些 第 三 方 管理 。 路 由 器 和 远程 控制 器 是 如 何 通信 的 呢 ? 通过 交换 包含 转发 
表 和 其 他 路 由 选择 信息 的 报 文 。 显 示 在 图 4-3 中 的 控制 平面 方法 是 软件 定义 网 络 (Soft- 
ware- Defined Networking, SDN) 的 本 质 ， 因 为 计算 转发 表 并 与 路 由 器 交互 的 控制 器 是 用 软 
件 实现 的 ， 故 网 络 是 “软件 定义 ”的 。 这 些 软件 实现 也 越 来 越 开放 ， 换 言 之 类 似 于 Linux 
操作 系统 代码 ， 这 些 代码 可 为 公众 所 用 ， 人 允许 ISP (以 及 网 络 研究 者 和 学 生 ) 去 创新 并 对 
控制 网 络 层 功能 的 软件 提出 更 改建 议 。 我 们 将 在 5.5 节 中 讨论 SDN 控制 平面 。 


4.1.2 网 络 服务 模型 


在 钻研 网 络 层 的 数据 平面 之 前 ， 我 们 将 以 开阔 的 视野 来 专注 于 我 们 引入 的 新 东西 并 考 
虑 网 络 层 可 能 提供 的 不 同类 型 的 服务 。 当 位 于 发 送 主机 的 运输 层 向 网 络 传输 分 组 时 (EE 
发 送 主机 中 将 分 组 向 下 交 给 网 络 层 ) ， 运 输 层 能 够 指望 网 络 层 将 该 分 组 交付 给 目的 地 吗 ? 
当 发 送 多 个 分 组 时 ， 它 们 会 按 发 送 顺序 按 序 交 付 给 接收 主机 的 运输 层 吗 ? 发 送 两 个 连续 分 
组 的 时 间 间 隔 与 接收 到 这 两 个 分 组 的 时 间 间 隔 相 同 吗 ? 网 络 层 会 提供 关于 网 络 中 拥塞 的 反 
馈 信 息 吗 ?在 发 送 主机 与 接收 主机 中 连接 运输 层 通 道 的 抽象 视图 (特性 ) 是 什么 ?对 这 些 
问题 和 其 他 问题 的 答案 由 网 络 层 提供 的 服务 模型 所 决定 。 网 络 服务 模型 (network service 
model) 定义 了 分 组 在 发 送 与 接收 端 系统 之 间 的 端 到 端 运输 特性 。 
我 们 现在 考虑 网 络 层 能 提供 的 某 些 可 能 的 服务 。 这 些 服务 可 能 包括 : 
© 确保 交付 。 该 服务 确保 分 组 将 最 终 到 达 目 的 地 。 
© 具有 时 延 上 界 的 确保 交付 。 该 服务 不 仅 确保 分 组 的 交付 ， 而 且 在 特定 的 主机 到 主机 
时 延 上 界 内 (例如 在 100ms 内 ) 交付 。 
e 有 序 分 组 交付 。 该 服务 确保 分 组 以 它们 发 送 的 顺序 到 达 目 的 地 。 
© 确保 最 小 带宽 。 这 种 网 络 层 服务 模仿 在 发 送 和 接收 主机 之 间 一 条 特定 比特 率 (例如 
1Mbps) ' 的 传输 链 路 的 行为 。 只 要 发 送 主机 以 低 于 特定 比特 率 的 速率 传输 比特 E 
为 分 组 的 组 成 部 分 ) ， 则 所 有 分 组 最 终 会 交付 到 目的 主机 。 
e. 安全 性 。 网 络 层 能 够 在 源 加 密 所 有 数据 报 并 在 目的 地 解密 这 些 分 组 ， 从 而 对 所 有 运 
输 层 报 文 段 提 供 机 密 性 。 
这 只 是 网 络 层 能 够 提供 的 服务 的 部 分 列表 ， 有 无 数 种 可 能 的 服务 变种 。 
因特网 的 网 络 层 提供 了 单一 的 服务 ， 称 为 尽力 而 为 服务 (best- effort service), (AVS 
力 而 为 服务 ， 传 送 的 分 组 既 不 能 保证 以 它们 发 送 的 顺序 被 接收 ， 也 不 能 保证 它们 最 终 交 
付 ; 既 不 能 保证 端 到 端 时 延 ， 也 不 能 保证 有 最 小 的 带宽 。 尽 力 而 为 服务 看 起 来 是 根本 无 服 
务 的 一 种 委婉 说 法 ， 即 一 个 没有 向 目的 地 交付 分 组 的 网 络 也 符合 尽力 而 为 交付 服务 的 定 
义 ! 其 他 的 网 络 体系 结构 已 定义 和 实现 了 超过 因特网 尽力 而 为 服务 的 服务 模型 。 例 如 ， 
ATM 网 络 体系 结构 [MFA Forum 2016; Black 1995] 提供 了 确保 按 序 时 延 、 有 界 时 延 和 确 
保 最 小 带宽 。 还 有 提议 的 对 因特网 体系 结构 的 服务 模型 扩展 ， 例 如 ， 集 成 服务 体系 结构 
[RFC 1633] 的 目标 是 提供 端 到 端 时 延 保 证 以 及 无 拥塞 通信 。 令 人 感 兴趣 的 是 ， 尽 管 有 这 
些 研发 良好 的 供 选 方案 ， 但 因特网 的 基本 尽力 而 为 服务 模型 与 适当 带宽 供给 相 结合 已 被 证 
明 超 过 “足够 好 ”， 能 够 用 于 大 量 的 应 用 ， 包 括 诸如 Netflix、IP 语音 和 视频 等 流 式 视频 服 
务 ， 以 及 诸如 Skype 和 Facetime 等 实时 会 议 应 用 。 
第 4 章 概述 


在 提供 了 网 络 层 的 概述 后 ， 我 们 将 在 本 章 后 续 几 节 中 讨论 网 络 层 的 数据 平面 组 件 。 在 
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4.2 节 中 ,我 们 将 深入 探讨 路 由 器 的 内 部 硬件 操作 ， 包 括 输 入 和 输出 分 组 处 理 、 路 由 器 的 
内 部 交换 机 制 以 及 分 组 排队 和 调度 。 在 4.3 节 中 ， 我 们 将 学 习 传 统 的 IP 转发 ， 其 中 分 组 
基于 它们 的 目的 IP 地 址 转发 到 输出 端口 。 我 们 将 学 习 到 IP 寻 址 、 令 人 称道 的 IPv4 和 IPv6 
协议 等 。 在 4.4 节 中 ,我 们 将 涉及 更 为 一 般 的 转发 ， 此 时 分 组 可 以 基于 大 量 首部 值 〈 即 不 
MEF A AY IP Hh) 转发 到 输出 端口 。 分 组 可 能 在 路 由 器 中 受阻 或 元 余 , 或 者 可 能 让 某 
些 首 部 字段 重 写 ， 即 所 有 都 在 软件 控制 之 下 完成 。 这 种 分 组 转发 的 更 为 一 般 的 形式 是 现代 
网 络 数 据 平面 的 关键 组 件 , -包括 软件 定义 网 络 (SDN) 中 的 数据 平面 。 

我 们 在 这 里 顺便 提 到 ， 许 多 计算 机 网 络 研究 者 和 从 业 人 员 经 常 互 换 地 使 用 转发 和 交换 
这 两 个 术语 。 我 们 在 这 本 教科 书 中 也 将 互 换 使 用 这 些 术语 。 在 我 们 开始 讨论 术语 的 主题 
时 ， 还 需要 指出 经 常 互 换 使 用 的 两 个 其 他 术语 ， 但 我 们 将 更 为 小 心地 使 用 它们 。 我 们 将 约 
定 术语 分 组 交换 机 是 指 一 台 通用 分 组 交换 设备 ， 它 根据 分 组 首部 字段 中 的 值 ， 从 输入 链 路 
接口 到 输出 链 路 接口 转移 分 组 。 某 些 分 组 交换 机 称 为 链 路 层 交 换 机 (link- layer switch ) 
(在 第 6 章 仔细 学 习 ) ， 基 于 链 路 层 帧 中 的 字段 值 做 出 转发 决定 ， 这 些 交换 机 因此 被 称 为 链 
路 层 〈 第 2 层 ) 设备 。 其 他 分 组 交换 机 称 为 路 由 器 (router) ， 基 于 网 络 层 数据 报 中 的 首部 
字段 值 做 出 转发 决定 。 路 由 器 因此 是 网 络 层 (第 3 层 ) 设备 。( 为 了 全 面 理解 这 种 重要 区 
别 ， 你 可 能 要 回顾 1. 5.2 节 ， 在 那里 我 们 讨论 了 网 络 层 数据 报 和 链 路 层 帧 及 其 关系 。) A 
为 在 本 章 中 我 们 关注 的 是 网 络 层 ， 所 以 我 们 将 主要 使 用 术语 路 由 器 来 代替 交换 机 。 


4.2 ”路 由 器 工作 原理 


既然 我 们 已 经 概述 了 网 络 层 中 的 数据 平面 和 控制 平面 、 转 发 与 路 由 选择 之 间 的 重要 区 
别 以 及 网 络 层 的 服务 与 功能 ， 我 们 将 注意 力 转 向 网 络 层 的 转发 功能 ， 即 实际 将 分 组 从 一 台 
路 由 器 的 入 链 路 传送 到 适当 的 出 链 路 。 

图 4-4 显示 了 一 个 通用 路 由 器 体系 结构 的 总 体 视 图 ， 其 中 标识 了 一 台 路 由 器 的 4 个 
组 件 。 







FF 三 一 一 一 


路 由 选择 ， 管 理 
控制 平面 (软件 ) 
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4-4 路 由 器 体系 结构 


。 给 入 端口 。 输 入 端口 〈input port) 执行 几 项 重要 功能 。 它 在 路 由 器 中 执行 终结 人 物 
理 链 路 的 物理 层 功 能 ， 这 显示 在 图 4-4 中 输入 端口 部 分 最 左 侧 的 方 框 与 输出 端口 部 
分 最 右 侧 的 方 框 中 。 它 还 要 与 位 于 入 链 路 远 端 的 数据 链 路 层 交 互 来 执行 数据 链 路 层 
功能 ， 这 显示 在 输入 与 输出 端口 部 分 中 间 的 方 框 中 。 也 许 更 为 重要 的 是 ， 在 输入 端 
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口 还 要 执行 查找 功能 ， 这 显示 在 输入 端口 最 右 侧 的 方 框 中 。 正 是 在 这 里 ， 通 过 查询 
转发 表决 定 路 由 器 的 输出 端口 ， 到 达 的 分 组 通过 路 由 器 的 交换 结构 转发 到 输出 端 
口 。 控 制 分 组 (如 携带 路 由 选择 协议 信息 的 分 组 ) 从 输入 端口 转发 到 路 由 选择 处 
理 器 。 注 意 这 里 的 “端口 ”一 词 ， 指 的 是 路 由 器 的 物理 输入 和 输出 接口 ， 这 完全 
不 同 于 第 2、3 章 中 所 讨论 的 与 网 络 应 用 程序 和 套 接 字 相关 联 的 软件 端口 。 在 实践 
中 ， 一 台 路 由 器 所 支持 的 端口 数量 范围 较 大 ， 从 企业 路 由 器 具有 数量 相对 少 的 端 
口 ， 到 位 于 某 ISP 边缘 的 路 由 器 具有 数 以 百 计 10Gbps 端口 (其 中 入 线路 的 数量 趋 
于 最 大 ) 。 例 如 ， 边 缘 路 由 器 Juniper MX2020 具有 80Tbps 的 总 体 路 由 器 系统 容量 ， 
支持 多 达 960 个 10Gbps 以 太 网 端口 [Juniper MX 2020 2016] 。 

交换 结构 。 交 换 结构 将 路 由 器 的 输入 端口 连接 到 它 的 输出 端口 。 这 种 交换 结构 完全 
包含 在 路 由 器 之 中 ,， 即 它 是 一 个 网 络 路 由 器 中 的 网 络 ! 

输出 端口 。 输 出 端口 存储 从 交换 结构 接收 的 分 组 ， 并 通过 执行 必要 的 链 路 层 和 物理 
层 功能 在 输出 链 路 上 传输 这 些 分 组 。 当 一 条 链 路 是 双向 的 时 ( 即 承 载 两 个 方向 的 流 
量 ) ,输出 端口 通常 与 该 链 路 的 输入 端口 成 对 出 现在 同一 线路 卡 上 。 

路 由 选择 处 理 器 。 路 由 选择 处 理 器 执行 控制 平面 功能 。 在 传统 的 路 由 器 中 ， 它 执行 
路 由 选择 协议 (我 们 将 在 5.3 节 和 5. 4 节 学 习 ) ， 维 护 路 由 选择 表 与 关联 链 路 状态 
信息 ， 并 为 该 路 由 器 计算 转发 表 。 在 SDN 路 由 器 中 ， 路 由 选择 处 理 器 (在 其 他 活 
动 中 ) 负责 与 远程 控制 器 通信 ， 目 的 是 接收 由 远程 控制 器 计算 的 转发 表 项 ， 并 在 该 
路 由 器 的 输入 端口 安装 这 些 表 项 。 路 由 选择 处 理 器 还 执行 网 络 管理 功能 ， 我 们 将 在 
5.7 节 学 习 相 关内 容 。 

路 由 器 的 输入 端口 、 输 出 端口 和 交换 结构 几乎 总 是 用 硬件 实现 ， 如 图 4-4 所 示 。 为 了 
理解 为 何 需要 用 硬件 实现 ， 考 虑 具有 10Cbps 输入 链 路 和 64 字 节 的 四 数据 报 ， 其 输入 端口 
在 男 一 个 数据 报到 达 前 仅 有 51. 2ns 来 处 理 数据 报 。 如 果 N 个 端口 结合 在 一 块 线 路 卡 上 
(因为 实践 中 常常 这 样 做 ) ， 数 据 报 处 理 流水 线 必须 以 NN 倍速 率 运 行 ， 这 远 快 过 软件 实现 
的 速率 。 转 发 硬件 既 能 够 使 用 路 由 器 厂商 自己 的 硬件 设计 来 实现 ， 也 能 够 使 用 购买 的 商用 
硅 片 (例如 由 英特尔 和 Broadcom 公司 所 出 售 ) 的 硬件 设计 来 实现 。 

当 数 据 平面 以 纳 秒 时 间 尺 度 运行 时 ， 路 由 器 的 控制 功能 以 毫秒 或 秒 时 间 尺 度 运行 ， 这 
些 控制 功能 包括 执行 路 由 选择 协议 、 对 上 线 或 下 线 的 连接 链 路 进行 响应 、 与 远程 控制 器 通 
fa (在 SDN 场合 ) 和 执行 管理 功能 。 因 而 这 些 控制 平面 (control plane) 的 功能 通常 用 软 
件 实现 并 在 路 由 选择 处 理 器 (通常 是 一 种 传统 的 CPU) 上 执行 。 

在 深入 探讨 路 由 器 的 内 部 细节 之 前 ,我们 转向 本 章 开头 的 那个 类 比 ， 其 中 分 组 转发 好 
比 汽车 进入 和 离开 立交 桥 。 假 定 该 立交 桥 是 环 状 交叉 路 ， 在 汽车 进入 该 环 状 交叉 路 前 ， 需 
要 做 一 点 处 理 。 我 们 来 考虑 一 下 对 于 这 种 处 理 需要 什么 信息 。 

e 基于 目的 地 转发 。 假 设 汽车 停 在 一 个 人 口 站 上 并 指示 它 的 最 终 目的 地 (并非 在 本 地 
环 状 交叉 路 ， 而 是 其 旅途 的 最 终 目 的 地 ) 。 入 口 站 的 一 名 服务 人 员 查 找 最 终 目的 地 ， 
决定 通 向 最 后 目的 地 的 环 状 交叉 路 的 出 口 ， 并 告诉 驾驶 员 要 走 哪 个 出 口 。 

e 通用 转发 。 除 了 目的 地 之 外 ， 服 务 人 员 也 能 够 基于 许多 其 他 因素 确定 汽车 的 出 口 功 
道 。 例 如 ， 所 选择 的 出 口 熙 道 可 能 与 该 汽车 的 起 点 如 发 行 该 车 牌照 的 州 有 关 。 来 自 
某 些 州 的 汽车 可 能 被 引导 使 用 某 个 出 口 臣 道 (经 过 一 条 慢 速 道路 通 向 目的 地 ) ， 而 
来 自 其 他 州 的 汽车 可 能 被 引导 使 用 一 个 不 同 的 出 口 臣 道 (经 过 一 条 高 速 路 通 向 目的 
地 ) 。 基 于 汽车 的 模型 、 品 牌 和 寿命 ， 可 能 做 出 相同 的 决定 。 或 者 认为 不 适合 上 路 
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的 汽车 可 能 被 阻止 并 且 不 允许 通过 环 状 交叉 路 。 就 通用 转发 来 说 ， 许 多 因素 都 会 对 
服务 人 员 为 给 定 汽车 选择 出 日 古道 产生 影响 。 

一 旦 汽车 进入 环 状 交叉 路 (该 环 状 交 叉 路 可 能 挤 满 了 从 其 他 输入 道路 进入 的 其 他 汽 
车 ， 朝 着 其 他 环 状 交叉 路 出 口 前 进 ) ， 并 且 最 终 离开 预定 的 环 状 交叉 路 出 口 古道 ， 在 这 里 
可 能 遇 到 了 从 该 出 口 离开 环 状 交叉 路 的 其 他 汽车 。 

在 这 个 类 比 中 ， 我 们 能 够 在 图 4-4 中 识别 最 重要 的 路 由 器 组 件 : 入 口 道路 和 入 口 站 对 
应 于 输入 端口 (具有 查找 功能 以 决定 本 地 输出 端口 ); 环 状 交叉 路 对 应 于 交换 结构 ; 环 状 
交叉 路 出 口 熙 道 对 应 于 输出 端口 。 借 助 于 这 个 类 比 ， 我 们 可 以 考虑 瓶颈 可 能 出 现 的 地 方 。 
如 果 汽 车 以 极 快 的 速率 到 达 〈 例 如 ， 该 环 状 交叉 路 位 于 德国 或 意大利 !) 而 车 站 服务 人 员 
很 慢 ， 将 发 生 什 么 情况 ?这 些 服务 人 员 必 须 工 作 得 多 快 ， 以 确保 在 入 口 路 上 没有 车 辆 拥 
堵 ? 甚至 对 于 极 快 的 服务 人 员 ， 如 果 汽 车 在 环 状 交叉 路 上 开 得 很 慢 ， 将 发 生 什么 情况 ， 拥 
堵 仍 会 出 现 吗 ? 如 果 大 多 数 进 入 的 汽车 都 要 在 相同 的 出 口 臣 道 离开 环 状 交叉 路 ， 将 发 生 什 
么 情况 ， 在 出 口 熙 道 或 别 的 什么 地 方 会 出 现 拥堵 吗 ? 如 果 我 们 要 为 不 同 的 汽车 分 配 优先 
权 ， 或 先行 阻挡 某 些 汽 车 进入 环 状 交叉 路 ， 环 状 交 叉 路 将 如 何 运 行 ? 这 些 全 都 与 路 由 器 和 
交换 机 设计 者 面 对 的 问题 形成 类 比 。 

在 下 面 的 各 小 节 中 ,我 们 将 更 为 详细 地 考察 路 由 器 功能 。 [Iyer 2008; Chao 2001; 
Chuang 2005; Turner 1988; McKeown 1997a; Partridge 1998; Sopranos 2011] 提供 了 对 一 
些 特 定 路 由 器 体系 结构 的 讨论 。 为 了 具体 和 简单 起 见 ， 我 们 在 本 节 中 初始 假设 转发 决定 仅 
基于 分 组 的 目的 地 址 ， 而 非 基 于 通用 的 分 组 首部 字段 。 我 们 将 在 4. 4 节 中 学 习 更 为 通用 的 
分 组 转发 情况 。 


4.2.1 输入 端口 处 理 和 基于 目的 地 转发 


图 4-5 中 显示 了 一 个 更 详细 的 输入 处 理 的 视图 。 如 前 面 讨论 的 那样 ， 输 入 端口 的 线 
路 端 接 功 能 与 链 路 层 处 理 实现 了 用 于 各 个 输入 链 路 的 物理 层 和 链 路 层 。 在 输入 端口 中 执 
行 的 查找 对 于 路 由 器 运行 是 至 关 重 要 的 。 正 是 在 这 个 地 方 ， 路 由 器 使 用 转发 表 来 查找 输 
出 端口 ， 使 得 到 达 的 分 组 能 经 过 交换 结构 转发 到 该 输出 端口 。 转 发 表 是 由 路 由 选择 处 理 
器 计算 和 更 新 的 〈 使 用 路 由 选择 协议 与 其 他 网 络 路 由 器 中 的 路 由 选择 处 理 器 进行 交 
互 ) ， 或 者 转发 表 接 收 来 自 远程 SDN 控制 器 的 内 容 。 转 发 表 从 路 由 选择 处 理 器 经 过 独立 
总 线 〈 例 如 一 个 PCI 总线 ) 复制 到 线路 卡 ， 在 图 4-4 中 该 总 线 由 从 路 由 选择 处 理 器 到 输 
和 线路 卡 的 虚线 所 指示 。 使 用 在 每 个 输入 端口 的 影子 副本 ， 转 发 决策 能 在 每 个 输入 端口 
本 地 做 出 ， 无 须 基 于 每 个 分 组 调用 集中 式 路 由 选择 处 理 器 ， 因 此 避免 了 集中 式 处 理 的 
瓶颈 。 








图 4-5 输入 端口 处 理 


现在 我 们 来 考虑 “最 简单 ”的 情况 ， 一 个 人 分 组 基于 该 分 组 的 目的 地 址 交换 到 输出 端 
口 。 在 32 比特 外 地 址 的 情况 下 ， 转 发 表 的 蛮 力 实现 将 针对 每 个 目的 地 址 有 一 个 表 项 。 因 
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为 有 超过 40 亿 个 可 能 的 地 址 ， 选 择 这 种 方法 总 体 上 是 不 可 行 的 。 
作为 一 个 说 明 怎 样 处 理 规 模 问 题 的 例子 ， 假 设 我 们 的 路 由 器 具有 4 条 链 路 ， 编 号 0 到 
3， 分 组 以 如 下 方式 转发 到 链 路 接口 : 
目的 地 址 范围 链 路 接口 


11001000 00010111 00010000 00000000 


到 0 
11001000 00010111 00010111 11111111 


11001000 00010111 00011000 00000000 
到 
11001000 00010111 00011000 11111111 


11001000 00010111 00011001 00000000 
到 2 
11001000 00010111 00011111 11111111 
其 他 3 
显然 ， 对 于 这 个 例子 ， 在 路 由 器 的 转发 表 中 没有 必要 有 40 亿 个 表 项 。 例 如 ， 我 们 能 
够 有 一 个 如 下 仪 包括 4 个 表 项 的 转发 表 : 


前 级 匹配 链 路 接口 


11001000 00010111 00010 0 
11001000 00010111 00011000 1 
11001000 00010111 00011 2 

其 他 3 


使 用 这 种 风格 的 转发 表 ， 路 由 器 用 分 组 目的 地 址 的 前 缀 (prefix) 与 该 表 中 的 表 项 进 
行 匹配 ; 如 果 存 在 一 个 匹配 项 ， 则 路 由 器 向 与 该 匹配 项 相关 联 的 链 路 转发 分 组 。 例 如 ， 假 
设 分 组 的 目的 地 址 是 11001000 00010111 00010110 10100001 ， 因 为 该 地 址 的 21 比特 前 缀 匹 
配 该 表 的 第 一 项 ， 所 以 路 由 器 向 链 路 接口 0 转发 该 分 组 。 如 果 一 个 前 级 不 匹配 前 3 项 中 的 
任何 一 项 ， 则 路 由 器 向 链 路 接口 3 转发 该 分 组 。 尽 管 听 起 来 足够 简单 ， 但 这 里 还 是 有 重要 
的 微妙 之 处 。 你 可 能 已 经 注意 到 一 个 目的 地 址 可 能 与 不 止 一 个 表 项 相 匹配 。 例 如 ， 地 址 
11001000 00010111 00011000 10101010 的 前 24 比特 与 表 中 的 第 二 项 匹配 ， 而 该 地 址 的 前 
21 比特 与 表 中 的 第 三 项 匹配 。 当 有 多 个 匹配 时 ， 该 路 由 器 使 用 最 长 前 缀 匹配 规则 (longest 
prefix matching rule); 即 在 该 表 中 寻找 最 长 的 匹配 项 ， 并 向 与 最 长 前 缀 匹配 相关 联 的 链 路 
接口 转发 分 组 。 当 在 4. 3 节 中 详细 学 习 因 特 网 编 址 时 ， 我 们 将 完全 明白 使 用 这 种 最 长 前 组 
匹配 规则 的 理由 。 

假定 转发 表 已 经 存在 ， 从 概念 上 讲 表 查找 是 简单 的 ， 硬 件 逻辑 只 是 搜索 转发 表 查找 最 
长 前 缀 匹配 。 但 在 吉 比 特 速率 下 ， 这 种 查找 必须 在 纳 秒 级 执行 〈 回 想 我 们 前 面 10Gbps 链 
路 和 一 个 64 字 节 下 数据 报 的 例子 ) 。 因 此 ， 不 仅 必须 要 用 硬件 执行 查找 ， 而 且 需 要 对 大 
型 转发 表 使 用 超出 简单 线性 搜索 的 技术 ; 快速 查找 算法 的 综述 能 够 在 [ Gupta 2001, Ruiz- 
Sanchez 2011] 中 找到 。 同 时 必须 对 内 存 访 问 时 间 给 予 特别 关注 ， 这 导致 用 共和 人 式 片 上 
DRAM 和 更 快 的 SRAM (用 作 一 种 DRAM 缓存 ) 内 存 来 设计 。 实 践 中 也 经 常 使 用 三 态 内 容 
可 寻 址 存储 器 (Tenary Content Address Memory, TCAM) 来 查找 [Yu 2004 ] 。 使 用 TCAM, 
一 个 32 比特 IP 地 址 被 放 和 内存，TCAM 在 基本 常数 时 间 内 返回 对 该 地 址 的 转发 表 项 的 内 
容 。Cisco Catalyst 6500 和 7500 系列 路 由 器 及 交换 机 能 够 保存 100 多 万 TCAM 转发 表 项 
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一 旦 通过 查找 确定 了 某 分 组 的 输出 端口 ， 则 该 分 组 就 能 够 发 送 进入 交换 结构 。 在 某 些 
设计 中 ， 如 果 来 自 其 他 输入 端口 的 分 组 当前 正在 使 用 该 交换 结构 ， 一 个 分 组 可 能 会 在 进入 
交换 结构 时 被 暂时 阻塞 。 因此， 一 个 被 阻塞 的 分 组 必须 要 在 输入 端口 处 排队 ， 并 等 待 稍 后 
被 及 时 调度 以 通过 交换 结构 。 我 们 稍 后 将 仔细 观察 分 组 〈 位 于 输入 端口 与 输出 端口 中 ) 的 
阻塞 、 排 队 与 调度 。 尽 管 “ 查 找 ” 在 输入 端口 处 理 中 可 认为 是 最 为 重要 的 动作 ， 但 必须 采 
取 许 多 其 他 动作 : 必须 出 现 物理 层 和 链 路 层 处 理 ， 如 前 面 所 讨论 的 那样 ;必须 检查 分 
组 的 版 本 号 、 检 验 和 以 及 寿命 字段 (这些 我 们 将 在 4.3 节 中 学 习 ) ， 并 且 重 写 后 两 个 字段 ; 
@ 必 须 更 新 用 于 网 络 管理 的 计数 器 ( 如 接收 到 的 TP 数据 报 的 数目 ) 。 

在 结束 输入 端口 处 理 的 讨论 之 前 ， 注 意 到 输入 端口 查找 目的 卫 地址 (“匹配 ”)， 然 后 
发 送 该 分 组 进入 交换 结构 (“动作”) 的 步骤 是 一 种 更 为 一 般 的 “匹配 加 动作 ”抽象 的 特 
定 情况 ， 这 种 抽象 在 许多 网 络 设备 中 执行 ， 而 不 仅 在 路 由 器 中 。 在 链 路 层 交换 机 (在 第 6 
章 讨论 ) 中 ， 除 了 发 送 帧 进入 交换 结构 去 往 输出 端口 外 ， 还 要 查找 链 路 层 目 的 地 址 ， 并 采 
取 几 个 动作 。 在 防火 墙 (在 第 8 章 讨 论 ) 中 ， 首 部 匹配 给 定 准则 〈 例 如 源 / 目 的 下 地 址 和 
运输 层 端口 号 的 某 种 组 合 ) 的 人 分 组 可 能 被 阻止 转发 ， 而 防火 墙 是 一 种 过 滤 所 选择 的 人 分 
组 的 设备 。 在 网 络 地 址 转换 器 (NAT， 在 4.3 节 讨 论 ) 中 ,一 个 运输 层 端口 号 匹配 某 给 定 
值 的 和 分 组 ， 在 转发 (动作 ) 前 其 端口 号 将 被 重 写 。 的 确 , “匹配 加 动作 ”抽象 不 仅 作用 
大 ， 而 且 在 网 络 设备 中 无 所 不 在 ， 并 且 对 于 我 们 将 在 4. 4 节 中 学 习 的 通用 转发 是 至 关 重 
要 的 。 


4.2.2 交换 


交换 结构 位 于 一 台 路 由 器 的 核心 部 位 ， 因 为 正 是 通过 这 种 交换 结构 ， 分 组 才能 实际 地 
从 一 个 输入 端口 交换 ( 即 转发 ) 到 一 个 输出 端口 中 。 交 换 可 以 用 许多 方式 完成 ， 如 图 4-6 
所 示 。 





图 例 : 
OLLIE 输入 端口 ECO 输出 端口 
图 4-6 三 种 交换 技术 
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经 内 存 交 换 。 最 简单 、 最 早 的 路 由 器 是 传统 的 计算 机 ， 在 输入 端口 与 输出 端口 之 
间 的 交换 是 在 CPU (路 由 选择 处 理 器 ) 的 直接 控制 下 完成 的 。 输 入 与 输出 端口 的 
功能 就 像 在 传统 操作 系统 中 的 1/0 设备 一 样 。 一 个 分 组 到 达 一 个 输入 端口 时 ， 该 
端口 会 先 通过 中 断 方式 向 路 由 选择 处 理 器 发 出 信号 。 于 是 ， 该 分 组 从 输入 端口 处 
被 复制 到 处 理 器 内 存 中 。 路 由 选择 处 理 器 则 从 其 首部 中 提取 目的 地 址 ， 在 转发 表 
中 找 出 适当 的 输出 端口 ， 并 将 该 分 组 复制 到 输出 端口 的 缓存 中 。 在 这 种 情况 下 ， 
如 果 内 存 带宽 为 每 秒 可 写 进 内 存 或 从 内 存 读 出 最 多 中 个 分 组 ， 则 总 的 转发 吞吐 量 
(分 组 从 输入 端口 被 传送 到 输出 端口 的 总 速率 ) 必然 小 于 8B/2。 也 要 注意 到 不 能 同 
时 转发 两 个 分 组 ， 即 使 它们 有 不 同 的 目的 端口 ， 因 为 经 过 共享 系统 总 线 一 次 仅 能 
执行 一 个 内 存 读 / 写 。 

许多 现代 路 由 器 通过 内 存 进行 交换 。 然 而 ， 与 早期 路 由 器 的 一 个 主要 差别 是 ， 
目的 地 址 的 查找 和 将 分 组 存储 (交换 ) 进 适 当 的 内 存 存储 位 置 是 由 输入 线路 卡 来 
处 理 的。 在 某 些 方面 ， 经 内 存 交换 的 路 由 器 看 起 来 很 像 共享 内 存 的 多 处 理 器 ,用 
一 个 线路 卡 上 的 处 理 将 分 组 交换 〈 写 ) 进 适当 的 输出 端口 的 内 存 中 。Cisco 的 Cat- 
alyst 8500 系列 的 交换 机 [Cisco 8500 2016] 是 经 共享 内 存 转发 分 组 的 。 
经 总 线 交 换 。 在 这 种 方法 中 ， 输 入 端口 经 一 根 共 享 总 线 将 分 组 直接 传送 到 输出 端 
口 ， 不 需要 路 由 选择 处 理 器 的 干预 。 通 常 按 以 下 方式 完成 该 任务 : 让 输入 端口 为 
分 组 预先 计划 一 个 交换 机 内 部 标签 〈 首 部 ) ， 指 示 本 地 输出 端口 ， 使 分 组 在 总 线 上 
传送 和 传输 到 输出 端口 。 该 分 组 能 由 所 有 输出 端口 收 到 ， 但 只 有 与 该 标签 匹配 的 
端口 才能 保存 该 分 组 。 然 后 标签 在 输出 端口 被 去 除 ， 因 为 其 仅 用 于 交换 机 内 部 来 
跨越 总 线 。 如 果 多 个 分 组 同时 到 达 路 由 器 ， 每 个 位 于 不 同 的 输出 端口 ， 除 了 一 个 
分 组 外 所 有 其 他 分 组 必须 等 待 ， 因 为 一 次 只 有 一 个 分 组 能 够 跨越 总 线 。 因 为 每 个 
分 组 必须 跨 过 单一 总 线 ， 故 路 由 器 的 交换 带宽 受 总 线 速 率 的 限制 ; 在 环 状 交叉 路 
的 类 比 中 ， 这 相当 于 环 状 交 叉 路 一 次 仅 包含 一 辆 汽车 。 尽 管 如 此 ， 对 于 运行 在 小 
型 局 域 网 和 企业 网 中 的 路 由 器 来 说 ， 通 过 总 线 交换 通常 足够 用 了 。Cisco 6500 路 由 
fit [Cisco 6500 2016] 内 部 通过 一 个 32Cbps 背 板 总 线 来 交换 分 组 。 
经 互联 网 络 交 换 。 克 服 单一 、 共 享 式 总 线 带宽 限制 的 一 种 方法 是 ,使 用 一 个 更 复 
杂 的 互联 网 络 ， 例 如 过 去 在 多 处 理 器 计算 机 体系 结构 中 用 来 互联 多 个 处 理 器 的 网 
络 。 纵 横 式 交换 机 就 是 一 种 由 2N 条 总 线 组 成 的 互联 网 络 ， 它 连接 NN 个 输入 端口 
RN 个 输出 端口 ， 如 图 4-6 所 示 。 每 条 垂直 的 总 线 在 交叉 点 与 每 条 水 平 的 总 线 交 
又 ， 交 叉 点 通过 交换 结构 控制 器 〈 其 逻辑 是 交换 结构 自身 的 一 部 分 ) 能 够 在 任何 
时 候 开启 和 闭合 。 当 某 分 组 到 达 端 口 A， 需 要 转发 到 端口 Y 时 ， 交 换 机 控制 器 闭 
合 总 线 A 和 了 交叉 部 位 的 交叉 点 ， 然 后 端口 A 在 其 总 线 上 发 送 该 分 组 ， 该 分 组 仅 
由 总 线 Y 接收。 注意 到 来 自 端 口 B 的 一 个 分 组 在 同一 时 间 能 够 转发 到 端口 X， 因 
为 A 到 Y 和 B 到 X 的 分 组 使 用 不 同 的 输入 和 输出 总 线 。 因 此 ， 与 前 面 两 种 交换 方 
法 不 同 ， 纵 横 式 网 络 能 够 并 行 转发 多 个 分 组 。 纵 横 式 交换 机 是 非 阻 塞 的 〈non- 
blocking) ， 即 只 要 没有 其 他 分 组 当前 被 转发 到 该 输出 端口 ， 转 发 到 输出 端口 的 分 
组 将 不 会 被 到 达 输 出 端口 的 分 组 阻塞 。 然 而 ， 如 果 来 自 两 个 不 同 输入 端口 的 两 个 
分 组 其 目的 地 为 相同 的 输出 端口 ， 则 一 个 分 组 必须 在 输入 端 等 待 ， 因 为 在 某 个 时 
刻 经 给 定 总 线 仅 能 够 发 送 一 个 分 组 。Cisco 12000 系列 交换 机 [ Cisco 12000 2016 | 
使 用 了 一 个 互联 网 络 ; Cisco 7600 系列 能 被 配置 为 使 用 总 线 或 者 纵横 式 交 换 机 
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[ Cisco 7600 2016 } 。 

更 为 复杂 的 互联 网 络 使 用 多 级 交换 元 素 ， 以 使 来 自 不 同 输入 端口 的 分 组 通过 
交换 结构 同时 朝 着 相同 的 输出 端口 前 行 。 对 交换 机 体系 结构 的 展望 可 参见 
[ Tobagi 1990 ] 。Cisco CRS 利用 了 一 种 三 级 非 阻塞 交换 策略 。 路 由 器 的 交换 能 力也 
能 够 通过 并 行 运行 多 种 交换 结构 进行 扩展 。 在 这 种 方法 中 ， 输 入 端口 和 输出 端口 
被 连接 到 并 行 运行 的 个 交换 结构 。 一 个 输入 端口 将 一 个 分 组 分 成 天 个 较 小 的 块 ， 
并 且 通 过 N 个 交换 结构 中 的 天 个 发 送 (“喷射 ") 这 些 块 到 所 选择 的 输出 端口 ， 输 
出 端口 再 将 天 个 块 装配 还 原 成 初始 的 分 组 。 


4.2.3 输出 端口 处 理 


如 图 4-7 中 所 示 ， 输 出 端口 处 理 取出 已 经 存放 在 输出 端口 内 存 中 的 分 组 并 将 其 发 送 到 
输出 链 路 上 。 这 包括 选择 和 取出 排队 的 


分 组 进行 传输 ， 执 行 所 需 的 链 路 层 和 物 ) | Tam] pep 


4.2.4 何 处 出 现 排队 


如 果 我 们 考虑 显示 在 图 4-6 中 的 输 
入 和 输出 端口 功能 及 其 配置 ， 下 列 情况 是 一 目 了 然 的 : 在 输入 端口 和 输出 端口 处 都 可 以 形 
成 分 组 队列 ， 就 像 在 环 状 交叉 路 的 类 比 中 我 们 讨论 过 的 情况 ， 即 汽车 可 能 等 待 在 流量 交叉 
点 的 入 口 和 出 口 。 排 队 的 位 置 和 程度 (或 者 在 输入 端口 排队 ,或 者 在 输出 端口 排队 ) 将 取 
决 于 流量 负载 、 交 换 结构 的 相对 速率 和 线路 速率 。 我 们 现在 更 为 详细 一 点 考虑 这 些 队列 ， 
因为 随 着 这 些 队列 的 增长 ， 路 由 器 的 缓存 空间 最 终 将 会 耗 尽 ， 并 且 当 无 内 存 可 用 于 存储 到 
达 的 分 组 时 将 会 出 现 委 包 (packet loss) 。 回 想 前 面 的 讨论 ， 我 们 说 过 分 组 “在 网 络 中 丢 
失 ” 或 “被 路 由 器 丢弃 " 。 正 是 在 一 台 路 由 器 的 这 些 队列 中 ， 这 些 分 组 被 实际 丢弃 或 
ER. 

假定 输入 线路 速度 与 输出 线路 速度 (传输 速率 ) 是 相同 的 ， 均 为 Ri,。( 单 位 为 每 秒 
分 组 数 )， 并 且 及 个 输入 端 日 和 WN 个 输出 端口 。 为 进一步 简化 讨论 ,假设 所 有 分 组 具 
有 相同 的 固定 长 度 , 分 组 以 同步 的 方式 到 达 输 入 端口 。 这 就 是 说 ， 在 任何 链 路 发 送 分 组 
的 时 间 等 于 在 任何 链 路 接收 分 组 的 时 间 ， 在 这 样 的 时 间 间 隔 内 ， 在 一 个 输入 链 路 上 能 够 
到 达 0 个 或 1 个 分 组 。 定 义 交 换 结构 传送 速率 Ros 为 从 输入 端口 到 输出 端口 能 够 移动 
分 组 的 速率 。 如 果 Ri LE Ri 快 N 倍 ， 则 在 输入 端口 处 仅 会 出 现 微不足道 的 排队 。 这 
是 因为 即使 在 最 坏 情况 下 ， 所 有 NN 条 输入 线路 都 在 接收 分 组 ， 并 且 所 有 的 分 组 将 被 转发 
到 相同 的 输出 端口 ， 每 批 Y 个 分 组 〈 每 个 输入 端口 一 个 分 组 ) 也 能 够 在 下 一 批 到 达 前 
通过 交换 结构 处 理 完 毕 。 

1. 输入 排队 

如 果 交 换 结 构 不 能 快 得 〈 相 对 于 输入 线路 速度 而 言 ) 使 所 有 到 达 分 组 无 时 延 地 通过 它 
传送 ， 会 发 生 什 么 情况 呢 ? 在 这 种 情况 下 ， 在 输入 端口 也 将 出 现 分 组 排队 ， 因 为 到 达 的 分 
组 必须 加 入 输入 端口 队列 中 ， 以 等 待 通过 交换 结构 传送 到 输出 端口 。 为 了 举例 说 明 这 种 排 
队 的 重要 后 果 ， 考 虑 纵横 式 交换 结构 ， 并 假定 : 中 所 有 链 路 速度 相同 ; 包 一 个 分 组 能 够 以 
一 条 输入 链 路 接收 一 个 分 组 所 用 的 相同 的 时 间 量 ， 从 任意 一 个 输入 端口 传送 到 给 定 的 输出 


图 4-7 输出 端口 处 理 
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端口 ; @ 分 组 按 FCFS 方式 ， 从 一 指定 输入 队列 移动 到 其 要 求 的 输出 队列 中 。 只 要 其 输出 
端口 不 同 ， 多 个 分 组 可 以 被 并 行 传送 。 然 而 ， 如 果 位 于 两 个 输入 队列 前 端的 两 个 分 组 是 发 
往 同 一 输出 队列 的 ， 则 其 中 的 一 个 分 组 将 被 阻塞 ， 且 必须 在 输入 队列 中 等 待 ， 因 为 交换 结 
构 一 次 只 能 传送 一 个 分 组 到 某 指定 端口 。 

图 4-8 显示 了 一 个 例子 ， 其 中 在 输入 队列 前 端的 两 个 分 组 〈 带 深 色 阴影 ) 要 发 往 同 一 
个 右上 角 输 出 端口 。 假 定 该 交换 结构 决 
定 发 送 左 上 角 队 列 前 端的 分 组 。 在 这 种 
情况 下 ， 左 下 角 队 列 中 的 深 色 阴影 分 组 
必须 等 待 。 但 不 仅 该 分 组 要 等 待 ， 左 下 
角 队 列 中 排 在 该 分 组 后 面 的 浅 色 阴影 分 
组 也 要 等 待 ， 即 使 右 中 侧 输出 端口 〈 浅 
色 阴 影 分 组 的 目的 地 ) 中 无 竞争 。 这 种 


在 时 刻 ( 的 输出 端 H 竞争 “能 传输 一 个 深 色 阴影 分 组 





现象 叫 作 输 入 排队 交换 机 中 的 线路 前 部 eee eee 

i i 部 让 =. 
( Head-Of-the-Line, HOL) 阻塞 ， 即 在 一 -= din O LA] mi = 
个 输入 队列 中 排队 的 分 组 必须 等 待 通过 ETC n Uo 
交换 结构 发 送 (即使 输出 端口 是 空闲 
的 ) ， 因 为 它 被 位 于 线路 前 部 的 另 一 个 分 —OLI EY my 
ote (Ree eS a “a 发 向 上 面 发 向 中 间 的 。 上 发 向 下 面 的 
HOL 阻塞 ,只 要 输入 链 路 上 的 分 组 到 达 Be i GARN 输出 端口 


速率 达到 其 容量 的 58% ， 在 某 些 假设 前 
EF, 输入 队列 长 度 就 将 无 限制 地 增 大 


图 4-8 在 一 个 输入 排队 交换 机 中 的 HOL 阻塞 


(不 严格 地 讲 ， 这 等 同 于 说 将 出 现 大 量 的 丢 包 )。[ McKeown 1997b] 讨论 了 多 种 解决 HOL 
阻塞 的 方法 。 

2. 输出 排队 

我 们 接 下 来 考虑 在 交换 机 的 输出 端口 是 否 会 出 现 排队 。 再 次 假定 Rowin E Rine tR N i, 
并 且 到 达 刘 个 输入 端口 的 每 个 端口 的 分 组 ， 其 目的 地 是 相同 的 输出 端口 。 在 这 种 情况 下 ， 
在 向 输出 链 路 发 送 一 个 分 组 的 时 间 内 ,将 及 个 新 分 组 到 达 该 输出 端口 (NN 个 输入 端口 的 
每 个 都 到 达 1 个 ) 。 因 为 输出 端口 在 一 个 单位 时 间 (该 分 组 的 传输 时 间 ) 内 仅 能 传输 一 个 
分 组 ， 这 入 个 到 达 分 组 必须 排队 (等待) 经 输出 链 路 传输 。 在 正好 传输 入 个 分 组 (这些 
分 组 是 前 面 正在 排队 的 ) 之 一 的 时 间 中 ， 可 能 又 到 达 个 分 组 ， 等 等 。 所 以 ， 分 组 队列 能 
够 在 输出 端口 形成 ， 即 使 交换 结构 比 端口 线路 速率 快 Y 倍 。 最 终 ， 排 队 的 分 组 数量 能 够 变 
得 足够 大 ， 耗 尽 输 出 端口 的 可 用 内 存 。 

当 没 有 足够 的 内 存 来 缓存 一 个 人 分 组 时 ， 就 必须 做 出 决定 : 要 么 丢弃 到 达 的 分 组 ( 采 
用 一 种 称 为 弃 尾 ( drop-tail) 的 策略 ) ， 要 么 删除 一 个 或 多 个 已 排队 的 分 组 为 新 来 的 分 组 腾 
出 空间 。 在 某 些 情况 下 ， 在 缓存 填 满 之 前 便 丢 弃 一 个 分 组 (或 在 其 首部 加 上 标记 ) 的 做 法 
是 有 利 的 ， 这 可 以 向 发 送 方 提供 一 个 拥塞 信和 号。 已 经 提出 和 分 析 了 许多 分 组 丢弃 与 标记 策 
i [Labrador 1999, Hollot 2002], ， 这 些 策 略 统称 为 主动 队列 管理 (Active Queue Manage- 
ment, AQM) 算法 。 随 机 早期 检测 (Random Early Detection, RED) 算法 是 得 到 最 广泛 研 
究 和 实现 的 AQM 算法 之 一 [Christiansen 2001; Floyd 2016] 。 
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在 图 4-9 中 图 示 了 输出 端口 的 排队 情况 。 在 时 刻 :， 每 个 人 端 输入 端口 都 到 达 了 一 个 
分 组 ， 每 个 分 组 都 是 发 往 最 上 侧 的 输出 端 在 时 刻 ! 的 输出 端口 竞争 
口 。 假 定 线路 速度 相同 ， 交 换 机 以 3 倍 于 A ~ 开机 E : 
线路 速度 的 速度 运行 ， 一 个 时 间 单 位 〈 即 
接收 或 发 送 一 个 分 组 所 需 的 时 间 ) 以 后 ， 
所 有 三 个 初始 分 组 都 被 传送 到 输出 端口 ， 
并 排队 等 待 传输 。 在 下 一 个 时 间 单 位 中 ， 
这 三 个 分 组 中 的 一 个 将 通过 输出 链 路 发 送 
出 去 。 在 这 个 例子 中 ， 又 有 两 个 新 分 组 已 
到 达 交 换 机 的 入 端 ; 这 些 分 组 之 一 要 发 往 
最 上 侧 的 输出 端口 。 这 样 的 后 果 是 ， 输 出 
端口 的 分 组 调度 (packet scheduler) 在 这 
些 排 队 分 组 中 选择 一 个 分 组 来 传输 ， 这 就 
是 我 们 将 在 下 节 中 讨论 的 主题 。 PETET 

假定 需要 路 由 器 缓存 来 吸收 流量 负载 的 波动 ， 一 个 自然 而 然 的 问题 就 是 需要 多 少 组 
存 。 多 年 以 来 ， 用 于 缓存 长 度 的 经 验方 法 是 [RFC 3439 ] ， 缓 存 数 量 (B) 应 当 等 于 平 
均 往 返 时 延 (RTT， 比 如 说 250ms) 乘 以 链 路 的 容量 (C) 。 这 个 结果 是 基于 相对 少量 的 
TCP 流 的 排队 动态 性 分 析 得 到 的 [Villamizar 1994]。 因 此 ， 一 条 具有 250ms RTT 的 
10Gbps 链 路 需要 的 组 存量 等 于 B =RIT'C=2.5Cb。 然 而 ， 最 近 的 理论 和 试验 研究 
[ Appenzeller 2004] 表明 ， 当 有 大 量 的 TCP 流 (N A) 流 过 一 条 链 路 时 ， 缓 存 所 需要 的 数 
量 是 B=RTT - C/VN。 对 于 通常 有 大 量 流 经 过 的 大 型 主干 路 由 器 链 路 (参见 如 [ Fraleigh 
2003]), N 的 值 可 能 非常 大 ， 所 需 的 缓存 长 度 的 减 小 相当 明显 。 [ Appenzeller 2004; Wis- 
chik 2005; Beheshti 2008] 从 理论 、 实现 和 运行 的 角度 提供 了 可 读 性 很 强 的 有 关 缓 存 长 度 
问题 的 讨论 。 


4.2.5 分 组 调度 


现在 我 们 转 而 讨论 确定 次 序 的 问题 ， 即 排队 的 分 组 如 何 经 输出 链 路 传输 的 问题 。 以 前 
你 自己 无 疑 在 许多 场合 都 排 长 队 等 竺 过， 并 观察 过 等 待 的 客户 怎样 被 服务 ， 你 无 疑 也 熟悉 
路 由 器 中 常用 的 许多 排队 规则 。 有 一 种 是 先 来 先 服务 (FCFS， 也 称 之 为 先进 先 出 
(FIFO) ) 。 这 是 英国 人 人 共 知 的 规则 ， 用 于 病人 就 诊 、 公 交 车 站 和 市 场 中 的 有 序 FCFS BA 
列 。( 哦 ， 你 排队 了 吗 ?) 有 些 国家 基于 优先 权 和 运转， 即 给 一 类 等 待 客户 超越 其 他 等 待 客户 
的 优先 权 服务 。 也 有 循环 排队 ， 其 中 客户 也 被 划分 为 类 别 〈 与 在 优先 权 队 列 一 样 ) ， 但 每 





类 用 户 依次 序 提供 服务 。 队列 
。 (等 待 区 域 ) 
1. 先进 先 出 到 达 _AF_, 
图 4-10 显示 了 对 于 先进 先 出 (First- 
In- First- Out, FIFO) 链 路 调度 规则 的 排 链 路 
队 模 型 的 抽象 。 如 果 链 路 当前 正 忙 于 传 (服务 器 ) 


输 另 一 个 分 组 ， 到 达 链 路 输出 队列 的 分 
组 要 排队 等 竺 传输。 如果 没有 足够 的 组 
存 空间 来 容纳 到 达 的 分 组 ， 队 列 的 分 组 备 弃 策略 则 确定 该 分 组 是 否 将 被 丢弃 (丢失 ) 或 者 


图 4-10 FIFO 排队 抽象 
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从 队列 中 去 除 其 他 分 组 以 便 为 到 达 的 分 组 腾 出 空间 ， 如 前 所 述 。 在 下 面 的 讨论 中 ,我 们 将 
忽视 分 组 丢弃 。 当 一 个 分 组 通过 输出 链 路 完全 传输 (也 就 是 接收 服务 ) 时 ， 从 队列 中 去 
除 它 。 

FIFO (也 称 为 先 来 先 服务 ，FCFS) 调度 规则 按照 分 组 到 达 输 出 链 路 队列 的 相同 次 序 
来 选择 分 组 在 链 路 上 传输 。 我 们 都 很 熟悉 服务 中 心 的 FIFO 排队， 在 那里 到 达 的 顾客 加 入 
单一 等 待 队列 的 最 后 ， 保 持 次 序 ， 然 后 当 他们 到 达 队 伍 的 前 面 时 就 接受 服务 。 

图 4-11 显示 了 运行 中 的 FIFO 队列 。 分 组 的 到 达 由 上 部 时 间 线 上 带 编号 的 箭头 来 指 
示 ， 用 编号 指示 了 分 组 到 达 的 次 序 。 各 个 分 组 的 离开 表示 在 下 部 时 间 线 的 下 面 。 分 组 在 服 
务 中 (被 传输 ) 花费 的 时 间 是 通过 这 两 个 时 间 线 之 间 的 阴影 矩形 来 指示 的 。 假 定 在 这 个 例 
子 中 传输 每 个 分 组 用 去 3 个 单位 时 间 。 利 用 FIFO 规则 ， 分 组 按照 到 达 的 相同 次 序 离开 。 
注意 在 分 组 4 离开 之 后 ， 在 分 组 5 到 达 之 前 链 路 保持 空闲 〈 因 为 分 组 1 ~4 已 经 被 传输 并 
从 队列 中 去 除 ) 。 
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图 4-11 运行 中 的 FIFO 队列 
2. 优先 权 排 队 


在 优先 权 排 队 (priority queuing) 规则 下 ， 到 达 输 出 链 路 的 分 组 被 分 类 放 和 人 输出 
队列 中 的 优先 权 类 ， 如 图 4-12 所 示 。 在 实践 中 ， 网 络 操作 员 可 以 配置 一 个 队列 ， 这 
样 携带 网 络 管理 信息 的 分 组 (例如 ， 由 源 或 目的 TCPAUDP 端口 号 所 标识 ) 获得 超过 
用 户 流量 的 优先 权 ; 此 外 ， 基 于 IP 的 实 高 优先 权 队列 ( 等 待 区 ) 

时 话音 分 组 可 能 获得 超过 非 实 时 流量 
(如 SMTP 或 IMAP 电子 邮件 分 组 ) 的 优 到 达 
先 权 。 每 个 优先 权 类 通常 都 有 自己 的 队 “  ” 
列 。 当 选择 一 个 分 组 传输 时 ， 优 先 权 排 





队 规则 将 从 队列 为 非 空 ( 也 就 是 有 分 组 A REEI FER) 
等 待 传输 ) 的 最 高 优先 权 类 中 传输 一 个 图 4-12 ”优先 权 排队 模型 
分 组 。 在 同一 优先 权 类 的 分 组 之 间 的 选 

择 通 常 以 FIFO 方式 完成 。 


图 4-13 描述 了 有 两 个 优先 权 类 的 一 个 优先 权 队列 的 操作 。 分 组 1、3 和 4 属于 高 
优先 权 类 ， 分 组 2 和 5 属于 低 优先 权 类 。 分 组 1 到 达 并 发 现 链 路 是 空闲 的 ， 就 开始 传 
输 。 在 分 组 1 的 传输 过 程 中 ， 分 组 2 和 3 到 达 ， 并 分 别 在 低 优 先 权 和 高 优先 权 队 列 中 
排队 。 在 传输 完 分 组 1 后 ， 分 组 3 (一 个 高 优先 权 的 分 组 ) 被 选择 在 分 组 2 (RFE 
到 达 得 较 早 ， 但 它 是 一 个 低 优 先 权 分 组 ) 之 前 传输 。 在 分 组 3 的 传输 结束 后 ， 分 组 2 
开始 传输 。 分 组 4 〈 一 个 高 优先 权 分 组 ) 在 分 组 2 (一 个 低 优先 权 分 组 ) 的 传输 过 程 
中 到 达 。 在 非 抢占 式 优先 权 排 队 (non-preemptive priority queuing) WW F, 一旦 分 组 
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开始 传输 ， 就 不 能 打 断 。 在 这 种 情况 下 ， 分 组 4 排队 等 待 传输 ， 并 在 分 组 2 传输 完成 
之 后 开始 传输 。 
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图 4-13 优先 权 队 列 的 操作 


3. 循环 和 加 权 公 平 排队 


在 循环 排队 规则 (round robin queuing discipline) 下 ， 分 组 像 使 用 优先 权 排 队 那 样 被 
分 类 。 然 而 ,在 类 之 间 不 存在 严格 的 服务 优先 权 ， 循 环 调度 器 在 这 些 类 之 间 轮 流 提 供 服 
务 。 在 最 简单 形式 的 循环 调度 中 ， 类 1 的 分 组 被 传输 ， 接 着 是 类 2 的 分 组 ， 接 着 又 是 类 1 
的 分 组 ， 再 接着 又 是 类 2 的 分 组 ， 等 等 。 一 个 所 谓 的 保持 工作 排队 (work- conserving queu- 
ing) 规则 在 有 【任何 类 的 ) 分 组 排队 等 待 传输 时 ， 不 允许 链 路 保持 空闲 。 当 寻找 给 定 类 
的 分 组 但 是 没有 找到 时 ， 保 持 工作 的 循环 规则 将 立即 检查 循环 序列 中 的 下 一 个 类 。 

图 4-14 描述 了 一 个 两 类 循环 队列 的 操作 。 在 这 个 例子 中 ， 分 组 1、2 和 4 属于 第 一 类 ， 
分 组 3 和 5 属于 第 二 类 。 分 组 1 一 到 达 输 出 队列 就 立即 开始 传输 。 分 组 2 和 3 在 分 组 1 的 
传输 过 程 中 到 达 ， 因 此 排队 等 待 传输 。 在 分 组 1 传输 后 ， 链 路 调度 器 查找 类 2 的 分 组 ， 因 
此 传输 分 组 3。 在 分 组 3 传输 完成 后 ， 调 度 器 查找 类 1 的 分 组 ， 因 此 传输 分 组 2。 在 分 组 2 
传输 完成 后 ， 分 组 4 是 唯一 排队 的 分 组 ， 因 此 在 分 组 2 后 立刻 传输 分 组 4。 
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图 4-14 两 类 循环 队列 的 操作 


一 种 通用 形式 的 循环 排队 已 经 广泛 地 实现 在 路 由 器 中 ， 它 就 是 所 谓 的 加 权 公 平 排队 
( Weighted Fair Queuing, WFQ) 规则 
[ Demers 1990; Parekh 1993; Cisco QoS 
2016], Al 4-15 对 WFQ 进行 了 描述 。 其 
中 ， 到 达 的 分 组 被 分 类 并 在 合适 的 每 个 
类 的 等 待 区 域 排 队 。 与 使 用 循环 调度 一 
样 ，WFQ 调度 器 也 以 循环 的 方式 为 各 个 
类 提供 服务 ， 即 首先 服务 第 1 类 ， 然 后 
服务 第 2 类 ， 接 着 再 服务 第 3 类 ， 然 后 有 
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(假设 有 3 个 类 别 ) 重复 这 种 服务 模式 。WFQ 也 是 一 种 保持 工作 排队 规则 ， 因 此 在 发 现 一 
个 空 的 类 队列 时 ， 它 立即 移 向 服务 序列 中 的 下 一 个 类 。 

WFQ 和 循环 排队 的 不 同 之 处 在 于 ， 每 个 类 在 任何 时 间 间 隔 内 可 能 收 到 不 同 数量 的 服 
务 。 具 体 而 言 ， 每 个 类 被 分 配 一 个 权 wi。 使 用 WFQ 方式 ， 在 类 i 有 分 组 要 发 送 的 任何 时 
间 间 隔 中 ， 第 i 类 将 确保 接收 到 的 服务 部 分 等 于 w 三 w,)， 式 中 分 母 中 的 和 是 计算 所 有 
有 分 组 排队 等 待 传 输 的 类 别 得 到 的 。 在 最 坏 的 情况 下 ， 即 使 所 有 的 类 都 有 分 组 排队 ,第 i 
类 仍然 保证 分 配 到 带宽 的 w/( Ew) 部 分 。 因 此 ， 对 于 一 条 传输 速率 为 RR 的 链 路 ， 第 i 类 
总 能 获得 至 少 为 RR wi/( wj) 的 吞吐 量 。 我 们 对 WFQ 的 描述 理想 化 了 ， 因 为 没有 考虑 
这 样 的 事实 : 分 组 是 离散 的 数据 单元 ， 并 且 不 能 打 断 一 个 分 组 的 传输 来 开始 传输 另 一 个 分 
组 ; [Demers 1990; Parekh 1993] 讨论 了 这 个 分 组 化 问题 。 


4.3 网 际 协议 : IPv4、 寻 址 、IPv6 及 其 他 


到 目前 为 止 ， 我 们 在 第 4 章 中 对 网 络 层 的 学 习 ， 包 括 网 络 层 的 数据 平面 和 控制 平面 组 
件 概 念 ， 转 发 和 路 由 选择 之 间 的 区 别 ， 各 种 网 络 服务 模型 的 标识 和 对 路 由 器 内 部 的 观察 ， 
并 未 提 及 任何 特定 的 计算 机 网 络 体系 结构 或 协议 。 在 这 节 中 ,我 们 将 关注 点 转向 今天 的 因 
特 网 网 络 层 的 关键 方面 和 著名 的 网 际 协议 (IP). l 

今天 有 两 个 版 本 的 IP 正在 使 用 。 在 4. 3.1 节 中 ,我 们 首先 研究 广泛 部 署 的 IP 版 本 4, 
这 通常 简单 地 称 为 Pv4 [RFC 791]。 在 4.3.5 节 中 , 我们 将 仔细 考察 PP 版 本 6 [RFC 
2460; RFC 4291 ] ， 它 已 经 被 提议 替代 IPv4。 在 中 间 ， 我 们 将 主要 学 习 因 特 网 编 址 ， 这 是 
一 个 看 起 来 相当 枯燥 和 面向 细节 的 主题 ， 但 是 这 对 理解 因特网 网 络 层 如 何 工 作 是 至 关 重 要 
的 。 掌 握 IP 编 址 就 是 掌握 因特网 的 网 络 层 ! 


4. 3. 1 IPv4 数据 报 格式 SEE 
前 面 讲 过 网 络 层 分 组 被 称 为 数据 报 。 «| MOR YE R ati (4248) 

我 们 以 概述 IPv4 数据 报 的 语法 和 语义 开 16 比 特 标识 标志 ”13 比特 片 偏 移 

始 对 他 的 学 习 。 你 也 许 认为 没有 什么 比 sage 一 一 一 

一 个 分 组 的 比特 的 语法 和 语义 更 加 本 煤 无 玉 a 

味 的 了 。 无 论 如 何 ， 数 据 报 在 因特网 中 起 IPS 

着 重要 作用 ， 每 个 网 络 行业 的 学 生 和 专业 32 比特 目的 P 地 址 

人 员 都 需要 理解 它 、 吸 收 它 并 掌握 它 (只 i 

是 理解 协议 首部 的 确 能 够 使 学 习 成 为 有 趣 en T Tai 

的 事 ， 请 查阅 [ Pomeranz 2010 ] ) IPv4 

数据 报 格式 如 图 4-16 所 示 。 图 4-16 ”IPv4 数据 报 格式 


IPv4 数据 报 中 的 关键 字段 如 下 : 

© 版 本 (号 )。 这 4 比特 规定 了 数据 报 的 他 协议 版 本 。 通 过 查看 版 本 号 ， 路 由 器 能 
够 确定 如 何 解释 P 数据 报 的 剩余 部 分 。 不 同 的 卫 版 本 使 用 不 同 的 数据 报 格式 。 
IPv4 的 数据 报 格式 如 图 4-16 所 示 。 新 版 本 的 J (IPv6) 的 数据 报 格式 将 在 4. 3.5 
节 中 讨论 。 

。 首部 长 度 。 因 为 一 个 IPv4 数据 报 可 包含 一 些 可 变数 量 的 选项 (这些 选项 包括 在 
IPv4 数据 报 首部 中 ) ， 故 需要 用 这 4 比特 来 确定 IP 数据 报 中 载荷 (例如 在 这 个 数 
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据 报 中 被 封装 的 运输 层 报 文 段 ) 实际 开始 的 地 方 。 大 多 数 IP 数据 报 不 包含 选项 ， 
所 以 一 般 的 IP BIR AA 20 字 节 的 首部 。 

服务 类 型 。 服 务 类 型 (TOS) 比特 包含 在 IPv4 首部 中 ， 以 便 使 不 同类 型 的 他 数 
据 报 (例如 ， 一些 特 别 要 求 低 时 延 、 高 吞吐 量 或 可 靠 性 的 数据 报 ) 能 相互 区 别 
开 来 。 例 如 ， 将 实时 数据 报 〈 如 用 于 P 电话 应 用 ) 与 非 实时 流量 (如 FIP) 区 
分 开 也 许 是 有 用 的 。 提 供 特 定 等 级 的 服务 是 一 个 由 网 络 管理 员 对 路 由 器 确定 和 
配置 的 策略 问题 。 我 们 在 3.7. 2 节 讨 论 明确 拥塞 通告 所 使 用 的 两 个 TOS 比特 时 
也 学 习 过 。 

数据 报 长 度 。 这 是 卫 数 据 报 的 总 长 度 (首部 加 上 数据 )， 以 字 节 计 。 因 为 该 字 
段 长 为 16 比特 ， 所 以 下 数据 报 的 理论 最 大 长 度 为 65 535 字 节 。 然 而 ， 数 据 报 
很 少 有 超过 1500 字 节 的 ， 该 长 度 使 得 全 数据 报 能 容纳 最 大 长 度 以 太 网 帧 的 载 
fil FEL 

标识 、 标 志 、 片 偏 移 。 这 三 个 字段 与 所 谓 卫 分 片 有 关 ， 这 是 一 个 我 们 将 很 快要 考 
虑 的 主题 。 有 趣 的 是 ， 新 版 本 的 人 ( 即 IPv6) 不 允许 在 路 由 器 上 对 分 组 分 片 。 
寿命 。 寿 命 (Time-To-Live，TTL) 字段 用 来 确保 数据 报 不 会 永远 〈 如 由 于 长 时 间 
的 路 由 选择 环 路 ) 在 网 络 中 循环 。 每 当 一 台 路 由 器 处 理 数 据 报 时 ， 该 字段 的 值 减 
1。 若 TTL 字 段 减 为 0， 则 该 数据 报 必须 丢弃 。 

协议 。 该 字段 通常 仅 当 一 个 中 数据 报到 达 其 最 终 目 的 地 时 才 会 有 用 。 该 字段 值 
指示 了 IP 数据 报 的 数据 部 分 应 交 给 哪个 特定 的 运输 层 协议 。 例 如 ， 值 为 6 表明 
数据 部 分 要 交 给 TCP， 而 值 为 17 表明 数据 要 交 给 UDP。 对 于 所 有 可 能 值 的 列 
K, AL [IANA Protocol Numbers 2016 ] 。 注 意 在 数据 报 中 的 协议 号 所 起 的 作 
用 ， 类 似 于 运输 层 报 文 段 中 端口 号 字段 所 起 的 作用 。 协 议 号 是 将 网 络 层 与 运输 
层 绑 定 到 一 起 的 黏合 剂 ， 而 端口 号 是 将 运输 层 和 应 用 层 绑 定 到 一 起 的 黏合 剂 。 
我 们 将 在 第 6 章 看 到 ， 链 路 层 帧 也 有 一 个 特殊 字段 用 于 将 链 路 层 与 网 络 层 绑 定 
到 一 起 。 

首部 检验 和 。 首 部 检验 和 用 于 帮助 路 由 器 检测 收 到 的 TP 数据 报 中 的 比特 错误 。 首 
部 检验 和 是 这 样 计算 的 : 将 首部 中 的 每 2 个 字 节 当 作 一 个 数 ， 用 反 码 算术 对 这 些 
数 求 和 。 如 在 3.3 节 讨 论 的 那样 ， 该 和 的 反 码 (被 称 为 因特网 检验 和 ) 存放 在 检 
验 和 字段 中 。 路 由 器 要 对 每 个 收 到 的 了 数据 报 计算 其 首部 检验 和 ， 如 果 数 据 报 首 
部 中 携带 的 检验 和 与 计算 得 到 的 检验 和 不 一 致 ， 则 检测 出 是 个 差错 。 路 由 器 一 般 
会 丢弃 检测 出 错误 的 数据 报 。 注 意 到 在 每 台 路 由 器 上 必须 重新 计算 检验 和 并 再 次 
存放 到 原 处 ， 因 为 TTL 字 段 以 及 可 能 的 选项 字段 会 改变 。 关 于 计算 因特网 检验 和 
的 快速 算法 的 有 趣 讨论 参见 [RFC 1071] 。 此 时 ， 一 个 经 常 问 的 问题 是 : 为 什么 
TCP/IP 在 运输 层 与 网 络 层 都 执行 差错 检测 ? 这 种 重复 检测 有 几 种 原因 。 首 先 ， 注 
意 到 在 全 层 只 对 IP 首 部 计算 了 检验 和 ， 而 TCPAUDP 检验 和 是 对 整个 TCPAUDP {k 
文 段 进行 的 。 其 次 ，TCP/UDP 与 IP 不 一 定 都 必须 属于 同一 个 协议 栈 。 原 则 上 ， 
TCP 能 够 运行 在 一 个 不 同 的 协议 (如 ATM) 上 [Black 1995], ， 而 卫 能 够 携带 不 
一 定 要 传递 给 TCP/UDP 的 数据 。 

源 和 目的 IP 地址 。 当 某 源 生成 一 个 数据 报时 ， 它 在 源 P 字段 中 插入 它 的 全 地 
址 ,在 目的 下 地 址 字段 中 搬入 其 最 终 目的 地 的 地 址 。 通 常 源 主机 通过 DNS 查找 
来 决定 目的 地 址 ， 如 在 第 2 章 中 讨论 的 那样 。 我 们 将 在 4. 3. 3 节 中 详细 讨论 IP 
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编 址 。 
。 选项 。 选 项 字段 允许 IP 首部 被 扩展 。 首 部 选项 意味 着 很 少 使 用 ， 因 此 决定 对 每 个 
数据 报 首部 不 包括 选项 字段 中 的 信息 ， 这 样 能 够 节约 开销 。 然 而 ,少量 选项 的 存 
在 的 确 使 问题 复杂 了 ， 因 为 数据 报 首部 长 度 可 变 ， 故 不 能 预先 确定 数据 字段 从 何 
处 开始 。 而 且 还 因为 有 些 数据 报 要 求 处 理 选项 ， 而 有 些 数据 报 则 不 要 求 ， 故 导致 
一 台 路 由 器 处 理 一 个 IP 数据 报 所 需 的 时 间 变 化 可 能 很 大 。 这 些 考 虑 对 于 高 性 能 路 
由 器 和 主机 上 的 IP 处理 来 说 特别 重要 。 由 于 这 样 或 那样 的 原因 ， 在 IPv6 首部 中 已 
去 掉 了 IP 选项， 如 4.3.5 节 中 讨论 的 那样 。 
。 数据 (有 效 载荷 )。 我 们 来 看 看 最 后 也 是 最 重要 的 字段 ， 这 是 数据 报 存在 的 首要 理 
由 ! 在 大 多 数 情 况 下 ，IP 数据 报 中 的 数据 字段 包含 要 交付 给 目的 地 的 运输 层 报 文 
Be (TCP 或 UDP)。 然 而 ,该 数据 字段 也 可 承载 其 他 类 型 的 数据 ， 如 ICMP 报 文 
(在 5.6 节 中 讨论 ) 。 
注意 到 一 个 全 数据 报 有 总 长 为 20 字 节 的 首部 〈 假 设 无 选项 ) 。 如 果 数 据 报 承载 一 个 
TCP 报 文 段 ; 则 每 个 〈 无 分 片 的 ) 数据 报 共 承载 了 总 长 40 字 节 的 首部 (20 字 节 的 卫 首 
部 加 上 20 字 节 的 TCP 首部 ) 以 及 应 用 层 报 文 。 


4.3.2 IPv4 数据 报 分 片 


在 第 6 章 中 我 们 将 看 到 ， 并 不 是 所 有 链 路 层 协议 都 能 承载 相同 长 度 的 网 络 层 分 组 。 有 
的 协议 能 承载 大 数据 报 ， 而 有 的 协议 只 能 承载 小 分 组 。 例 如 ， 以 太 网 帧 能 够 承载 不 超过 
1500 字 节 的 数据 ， 而 某 些 广 域 网 链 路 的 帧 可 承载 不 超过 576 字 节 的 数据 。 一 个 链 路 层 帧 能 
承载 的 最 大 数据 量 叫 作 最 大 传送 单元 (Maximum Transmission Unit，MTU ) 。 因 为 每 个 卫 数 
据 报 封 装 在 链 路 层 帧 中 从 一 台 路 由 器 传输 到 下 一 台 路 由 器 ， 故 链 路 层 协议 的 MTU 严格 地 
限制 着 IP 数据 报 的 长 度 。 对 IP 数据 报 长 度 具 有 严格 限制 并 不 是 主要 问题 。 问 题 在 于 在 发 
送 方 与 目的 地 路 径 上 的 每 段 链 路 可 能 使 用 不 同 的 链 路 层 协 议 ， 且 每 种 协议 可 能 具有 不 同 
的 MTU。 

为 了 更 好 地 理解 这 一 转发 问题 ， 想 象 你 是 一 台 互 联 几 条 链 路 的 路 由 器 ， 且 每 条 链 路 
运行 具有 不 同 MTU 的 链 路 层 协 议 。 假 定 你 从 某 条 链 路 收 到 一 个 中 数据 报 ， 通 过 检查 转 
发 表 确 定 出 链 路 ， 并 且 该 条 出 链 路 的 MTU 比 该 卫 数据 报 的 长 度 要 小 。 此 时 你 会 感到 人 慌 
乱 ， 如 何 将 这 个 过 大 的 IP 分 组 挤 进 链 路 层 帧 的 有 效 载荷 字段 呢 ? 解决 该 问题 的 方法 是 
将 数据 报 中 的 数据 分 片 成 两 个 或 更 多 个 较 小 的 TP 数 据 报 ， 用 单独 的 链 路 层 帧 封装 这 
些 较 小 的 IP 数据 报 ， 然 后 通过 输出 链 路 发 送 这 些 帧 。 每 个 这 些 较 小 的 数据 报 都 称 为 片 
( fragment) 。 

片 在 其 到 达 目 的 地 运输 层 以 前 需要 重新 组 装 。TCP 与 UDP 的 确 都 希望 从 网 络 层 收 
到 完整 的 、 未 分 片 的 报 文 。IPv4 的 设计 者 感到 在 路 由 器 中 重新 组 装 数据 报 会 给 协议 带 
来 相当 大 的 复杂 性 并 且 影 响 路 由 器 的 性 能 。( 如 果 你 是 一 台 路 由 器 ， 你 愿意 将 重新 组 
装 报 文 片 放 在 你 必须 要 做 的 各 种 各 样 工作 的 首位 吗 ?) 为 坚持 网 络 内 核 保持 简单 的 原 
则 ，IPv4 的 设计 者 决定 将 数据 报 的 重新 组 装 工 作 放 到 端 系统 中 ， 而 不 是 放 到 网 络 路 由 
器 中 。 

当 一 台 目 的 主机 从 相同 源 收 到 一 系列 数据 报时 ， 它 需要 确定 这 些 数据 报 中 的 某 些 是 否 
是 一 些 原来 较 大 的 数据 报 的 片 。 如 果 某 些 数 据 报 是 这 些 片 的 话 ， 则 它 必须 进一步 确定 何 时 
收 到 了 最 后 一 片 ， 并 且 如 何 将 这 些 接收 到 的 片 拼接 到 一 起 以 形成 初始 的 数据 报 。 为 了 让 目 
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的 主机 执行 这 些 重 新 组 装 任务 ，IPv4 的 设计 者 将 标识 、 标 志和 片 偏 移 字段 放 在 IP 数据 报 
首部 中 。 当 生成 一 个 数据 报时 ， 发 送 主 机 在 为 该 数据 报 设置 源 和 目的 地 址 的 同时 贴 上 标识 
号 。 发 送 主机 通常 将 它 发 送 的 每 个 数据 报 的 标识 号 加 1。 当 某 路 由 器 需要 对 一 个 数据 报 分 
片 时 ， 形 成 的 每 个 数据 报 (BI) 具有 初始 数据 报 的 源 地 址 、 目 的 地 址 与 标识 号 。 当 目的 
地 从 同一 发 送 主机 收 到 一 系列 数据 报时 ， 它 能 够 检查 数据 报 的 标识 号 以 确定 哪些 数据 报 实 
际 上 是 同一 较 大 数据 报 的 片 。 由 于 IP 是 一 种 不 可 靠 的 服务 ， 一 个 或 多 个 片 可 能 永远 到 达 
不 了 目的 地 。 因 为 这 种 原因 ， 为 了 让 目的 主机 绝对 地 相信 它 已 收 到 了 初始 数据 报 的 最 后 一 
个 片 ， 最 后 一 个 片 的 标志 比特 被 设 为 0， 而 所 有 其 他 片 的 标志 比特 被 设 为 1。 另 外 ， 为 了 
让 目的 主机 确定 是 否 丢 失 了 一 个 片 ( 且 能 按 正确 的 顺序 重新 组 装 片 ) ， 使 用 偏 移 字段 指定 
该 片 应 放 在 初始 IP 数据 报 的 哪个 位 置 。 

图 4-17 图 示 了 二 个 例子 。 一 个 
4000 字 节 的 数据 报 (20 F IP 首部 
加 上 3980 字 节 IP 有 效 载 和 荷 ) 到 达 一 
台 路 由 器 ， 且 必须 被 转发 到 一 条 MTU 
为 1500 字 节 的 链 路 上 。 这 就 意味 着 初 
始 数据 报 中 3980 字 节 数据 必须 被 分 配 
为 3 个 独立 的 片 (其 中 的 每 个 片 也 是 
一 个 人 数据 报 )。 

本 书 的 在 线材 料 和 本 章 后 面 的 习 
题 将 使 你 能 够 详细 探究 分 片 。 在 本 书 
的 Web 站 点 上 ， 我 们 提供 了 一 个 Java 
小 程序 来 产生 片 。 提 供 入 数据 报 长 度 、 
MTU 和 入 数据 报 标识 ， 它 就 会 自动 为 图 4-17 IP 分 片 与 重新 组 装 
你 产生 片 。 参 见 http://www. pearsonhighered. com/cs-resources/ 。 


4.3.3 IPv4 编 址 








分 片 : 
A: 一 个 大 数据 报 (4000 字 节 ) 
出 : 3 个 较 小 数据 报 


链 路 MTU: 1500 字 节 
a So 






入 : 3 个 较 小 数据 报 
出 : 一 个 大 数据 报 ( 4000 字 节 ) 


我 们 现在 将 注意 力 转向 IPv4 编 址 。 尽 管 你 可 能 认为 编 址 是 相当 直接 的 主题 ， 但 我 们 希望 
通过 本 章 的 学 习 ， 你 能 认识 到 因特网 编 址 不 仅 是 一 个 丰富 多 彩 、 微 妙 和 有 趣 的 主题 ， 而 且 也 
是 一 个 对 因特网 极为 重要 的 主题 。[ Stewart 1999] 的 第 1 章 是 介绍 IPv4 编 址 的 优秀 读物 。 

然而 ， 在 讨论 IP 编 址 之 前 ， 我 们 需要 简 述 一 下 主机 与 路 由 器 连 人 网 络 的 方法 。 一 台 
主机 通常 只 有 一 条 链 路 连接 到 网 络 ; 当主 机 中 的 IP 想 发 送 一 个 数据 报时 ， 它 就 在 该 链 路 
上 发 送 。 主 机 与 物理 链 路 之 间 的 边界 叫 作 接 口 (interface ) 。 现 在 考虑 一 台 路 由 器 及 其 接 
口 。 因 为 路 由 器 的 任务 是 从 链 路 上 接收 数据 报 并 从 某 些 其 他 链 路 转发 出 去 ， 路 由 器 必须 拥 
有 两 条 或 更 多 条 链 路 与 它 连 接 。 路 由 器 与 它 的 任意 一 条 链 路 之 间 的 边界 也 叫 作 接口 。 一 台 
路 由 器 因此 有 多 个 接口 ， 每 个 接口 有 其 链 路 。 因 为 每 台 主 机 与 路 由 器 都 能 发 送 和 接收 IP 
数据 报 ，IP 要 求 每 台 主 机 和 路 由 器 接口 拥有 自己 的 卫 地 址 。 因 此 ， 从 技术 上 讲 ， 一 个 了 琴 
地 址 与 一 个 接口 相关 联 ， 而 不 是 与 包括 该 接口 的 主机 或 路 由 器 相关 联 。 

每 个 IP 地址 长 度 为 32 比特 (等 价 为 4 字 节 )， 因 此 总 共有 2” 个 (或 大 约 40 亿 个 ) 
可 能 的 下 地 址 。 这 些 地 址 通常 按 所 谓 点 分 十 进 制 记 法 (dotted-decimal notation) 书写 ， 即 
地 址 中 的 每 个 字 节 用 它 的 十 进 制 形式 书写 ， 各 字 节 间 以 句点 隔 开 。 例 如 ， 考虑 IP 地 址 
193. 32. 216.9, 193 是 该 地 址 的 第 一 个 8 比特 的 十 进 制 等 价 数 ，32 是 该 地 址 的 第 二 个 8 比 
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特 的 十 进 制 等 价 数 ， 依 次 类 推 。 因 此 ， 地 址 193. 32. 216.9 的 二 进 制 记 法 是 : 
11000001 00100000 11011000 00001001 

在 全 球 因 特 网 中 的 每 台 主 机 和 路 由 器 上 的 每 个 接口 ， 都 必须 有 一 个 全 球 唯 一 的 下地 
HE (Æ NAT 后 面 的 接口 除外 ,在 4.3.4 节 中 讨论 )。 然 而 ， 这 些 地 址 不 能 随意 地 自由 选 
择 。 一 个 接口 的 他 地 址 的 一 部 分 需要 由 其 连接 的 子 网 来 决定 。 

图 4-18 提供 了 一 个 全 编 址 与 接口 的 例子 。 在 该 图 中 ,一 台 路 由 器 (具有 3 个 接口 ) 
用 于 互联 7 台 主 机 。 仔 细 观 察 分 配给 主机 和 路 由 器 接口 的 卫 地 址 ， 有 几 点 需要 注意 。 
图 4-18 中 左上 侧 的 3 台 主 机 以 及 它们 连接 的 路 由 器 接口 ， 都 有 一 个 形 如 223. 1. 1. xxx 的 他 
地 址 。 这 就 是 说 ， 在 它们 的 地址 中 ,最 左 侧 的 24 比特 是 相同 的 。 这 4 个 接口 也 通过 一 
个 并 不 包含 路 由 器 的 网 络 互 联 起 来 。 该 网 络 可 能 由 一 个 以 太 网 LAN 互联 ， 在 此 情况 下 ， 
这 些 接口 将 通过 一 台 以 太 网 交换 机 互联 (如 第 6 章 中 讨论 的 那样 ) ， 或 者 通过 一 个 无 线 接 
入 点 互联 (如 第 7 章 中 讨论 的 那样 ) 。 我 们 此 时 将 这 种 无 路 由 器 连接 这 些 主机 的 网 络 表示 
为 一 条 云 ， 在 第 6、7 章 中 再 深入 这 些 网 络 的 内 部 。 


223.1.2.1 


223.1.1.2 


P- R 
223.1.1.3 


223.1.3.1 223.1.3.2 
图 4-18 接口 地 址 和 子 网 


用 下 的 术语 来 说 ,互联 这 3 个 主机 接口 与 1 个 路 由 器 接口 的 网 络 形成 一 个 子 网 (sub- 
net) [RFC 950] 。( 在 因特网 文献 中 ， 子 网 也 称 为 IP 网 络 或 直接 称 为 网 络 。) IP 编 址 为 这 个 
子 网 分 配 一 个 地 址 223. 1. 1.0/24, 其 中 的 二。 

/24 ite, At NF (network af Wp | 
mask) ， 指 示 32 比特 中 的 最 左 侧 24 比特 223.1.2.0724 f= 
定义 了 子 网 地 址 。 因 此 子 网 223. 1. 1.0/24 


3 PERLE (223.1.1.1, 223.1.1.2 mÅ 
和 223.1.1.3) 和 1 个 路 由 器 接口 





(223.1.1.4) 组 成 。 任 何其 他 要 连 到 223.1.3.0/24 
223. 1. 1. 0/24 网 络 的 主机 都 要 求 其 地 址 具 

有 223. 1. 1. xxx 的 形式 。 图 4-18 中 显示 了 =" t 
另外 两 个 网 络 : 223. 1.2.0/24 网 络 与 


223. 1.3.0/24 子 网 。 图 4- 19 图 示 了 在 图 4-19 子 网 地 址 
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图 4-18 中 存在 的 3 个 全 子 网 。 

一 个 子 网 的 IP 定义 并 不 局 限于 连接 多 台 主 机 到 一 个 路 由 器 接口 的 以 太 网 段 。 为 了 搞 
清 其 中 的 道理 ， 可 考虑 图 4-20， 图 中 显示 了 3 台 通 过 点 对 点 链 路 彼此 互联 的 路 由 器 。 每 台 
路 由 器 有 3 个 接口 ， 每 条 点 对 点 链 路 使 用 一 个 ， 一 个 用 于 直接 将 路 由 器 连接 到 一 对 主机 的 
广播 链 路 。 这 里 出 现 了 几 个 子 网 呢 ? 3 个 子 网 223. 1. 1. 0/24 、223. 1. 2. 0/24 和 223. 1.3. 0X 
24 类 似 于 我 们 在 图 4-18 中 遇 到 的 子 网 。 但 注意 到 在 本 例 中 还 有 其 他 3 个 子 网 : 一 个 子 网 
是 223. 1. 9. 0/24 ， 用 于 连接 路 由 器 RI 与 R2 的 接口 ; 另外 一 个 子 网 是 223. 1.8.0/24, 用 
于 连接 路 由 器 R2 与 R3 的 接口 ; 第 三 个 子 网 是 223. 1.7. 0/24 ， 用 于 连接 路 由 器 R3 与 RI 
的 接口 。 对 于 一 个 路 由 器 和 主机 的 通用 互联 系统 ， 我 们 能 够 使 用 下 列 有 效 方法 定义 系统 中 
的 子 网 : 

为 了 确定 子 网 ， 分 开 主 机 和 路 由 器 的 每 个 接口 ， 产 生 几 个 隔离 的 网 络 岛 ， 使 
用 接口 端 接 这 些 隔离 的 网 络 的 端点 。 这 些 隔 离 的 网 络 中 的 每 一 个 都 叫 作 一 个 子 网 
(subnet) 
223.1.1.1 223.1.1.4 


üü 


223.1:13 
aa 


PE 223.1.7.0 












223.1.9.1 ; 
223.1.7.1 
A 






223.1.8.1 外 2231327 


223.1.2.1 223.1.2.2 223.1.3.1 223.1.3.2 
图 4-20 3 台 路 由 器 互联 6 个 子 网 


如 果 我 们 将 该 过 程 用 于 图 4-20 中 的 互联 系统 上 ， 会 得 到 6 个 岛 或 子 网 。 

从 上 述 讨论 显然 可 以 看 出 ,一 个 具有 多 个 以 太 网 段 和 点 对 点 链 路 的 组 织 (如 一 个 公司 
或 学 术 机 构 ) 将 具有 多 个 子 网 ， 在 给 定子 网 上 的 所 有 设备 都 具有 相同 的 子 网 地 址 。 原 则 
E, 不 同 的 子 网 能 够 具有 完全 不 同 的 子 网 地 址 。 人 然而， 在 实践 中 ， 它 们 的 子 网 地 址 经 常 有 
许多 共同 之 处 。 为 了 理解 其 中 的 道理 ， 我 们 来 关注 在 全 球 因特网 中 是 如 何 处 理 编 址 的 。 

因特网 的 地 址 分 配 策 略 被 称 为 无 类 别 域 间 路 由 选择 (Classless Interdomain Routing, 
CIDR) [RFC 4632]。CIDR 将 子 网 寻 址 的 概念 一 般 化 了 。 当 使 用 子 网 寻 址 时 ，32 比特 的 
IP 地 址 被 划分 为 两 部 分 ， 并 且 也 具有 点 分 十 进 制 数 形式 a. b. c. d/x， 其 中 x 指示 了 地 址 的 
第 一 部 分 中 的 比特 数 。 
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形式 为 a. b. c. d/x 的 地 址 的 x 最 高 比特 构成 了 IP 地 址 的 网 络 部 分 ， 并 且 经 常 被 称 为 该 
地 址 的 前 缀 (prefix) (或 网 络 前 缓 ) 。 一 个 组 织 通常 被 分 配 一 块 连续 的 地 址 ， 即 具有 相同 
前 组 的 一 段 地 址 〈 参 见 “ 实 践 原则 ”) 。 在 这 种 情况 下 ， 该 组 织 内 部 的 设备 的 IP 地 址 将 共 
享 共同 的 前 级 。 当 我 们 在 5. 4 节 中 论 及 因特网 的 BCP 路 由 选择 协议 时 ， 将 看 到 该 组 织 网 络 
外 部 的 路 由 器 仅 考虑 前 面 的 前 绥 比 特 *x。 这 就 是 说 ， 当 该 组 织 外 部 的 一 台 路 由 天 转发 一 个 
数据 报 ， 且 该 数据 报 的 目的 地 址 位 于 该 组 织 的 内 部 时 ， 仅 需要 考虑 该 地 址 的 前 面 * 比特 。 
这 相当 大 地 减少 了 在 这 些 路 由 器 中 转发 表 的 长 度 ， 因 为 形式 为 a. b. c. d/x 的 单一 表 项 足以 
将 数据 报 转发 到 该 组 织 内 的 任何 目的 地 。 





| 这 是 一 个 ISP 将 8 个 组 织 连接 到 因特网 的 例子 ， 它 也 很 好 地 说 明了 和 仔细 分 配 CIDR 
化 的 地 址 有 利于 路 由 选择 的 道理 。 如 图 4-21 所 示 ， 假设 该 ISP (我 们 称 之 为 Fly- By- 
Night-ISP) 向 外 界 通告 ， 它 应 该 发 送 所 有 地 址 的 前 20 比特 与 200. 23. 16.0/20 相符 的 数 
据 报 。 外 界 的 其 他 部 分 不 需要 知道 在 地 址 块 200. 23. 16. 0/20 内 实际 上 还 存在 8 个 其 他 
组 织 ， 其 中 每 个 组 织 有 自己 的 子 网 。 这 种 使 用 单个 网 络 前 组 通告 多 个 网 络 的 能 力 通常 称 . 
为 地 址 聚合 (address aggregation ) ， 也 称 为 路 由 聚合 (route aggregation) 或 路 由 摘要 


(route summarization ) 。 


组 织 0 
200.23.16.0/23 
“向 我 发 送 以 
组 织 1 W 
<a 200.23.16.0/20 
200,23:18.023_ ~ 开始 的 任何 东西 ” 
aw Fayns —— 
2002320008 z7 
因特网 
组 织 7 
200.23.30.0/23 “向 我 发 送 以 
199.31.0.0/16 
一 aa ， 开 始 的 任何 东西 ” 
GO 
Se 


图 4-21 层次 编 址 与 路 由 聚合 


当地 址 按 块 分 给 ISP， 然 后 又 由 ISP 分 给 客户 组 织 时 ， 地 址 聚合 工作 极为 有 效 。 但 
是 当地 址 不 是 按 这 样 的 层次 方式 分 配 时 ， 会 出 现 什么 情况 呢 ? 例如 ， 如 果 Fly-By-Night | 
ISP 获取 了 ISPs-R-Us， 然 后 让 组 织 1 通过 它 辅助 的 ISPs-R-Us 与 因特网 相连 ， 将 会 发 生 
什么 情况 呢 ? 如 图 4-21 中 所 示 ， 该 辅助 的 ISPs-R-Us 拥有 地 址 块 199.31. 0. 07/16， 但 很 
遗憾 的 是 组 织 1 的 四 地 址 在 该 地 址 块 之 外 。 这 里 可 以 采取 什么 措施 呢 ? 组织 1 无 疑 可 以 
将 其 所 有 的 路 由 器 和 主机 重新 编号 ， 使 得 地 址 在 ISPs-R-Us 的 地 址 块 内 。 但 这 是 一 种 代 | 
价 很 高 的 方案 ， 而 且 组 织 1 将 来 也 许 还 会 从 ISPs-R- Us 更 换 到 另 一 个 ISP。 采 用 的 典型 | 
| 方案 是 ， 组 织 1 保持 其 IP 地 址 在 200. 23. 18. 0/23 内 。 在 这 种 情况 下 ， 如 图 4-22 所 示 ， 
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| Fly- By- Night- ISP 继续 通告 地 址 块 200. 23. 16. 0/20， 并 且 ISPs- R- Us 也 继续 通告 地 址 块 
199. 31. 0. 0/16。 然 而 ，JISPs-R- Us 现在 还 要 通告 组 织 1 的 地 址 块 200. 23. 18.0/23, HH 
| 更 大 的 因特网 上 的 其 他 路 由 器 看 见地 址 块 200. 23. 16. 0/20 (来 自 Fly-By-Night-ISP) 和 
200. 23. 18.0/23 (来 自 ISPs-R-Us)， 并 且 想 路 由 选择 到 地 址 块 200. 23. 18.0/23 内 的 一 
| 个 地 址 时 ， 它 们 将 使 用 最 长 前 缀 匹配 (参见 4.2.1 节 )， 并 朝 着 ISPs-R- Us 路 由 ， 因 为 
| 它 通告 了 与 目的 地 址 相 匹 配 的 最 长 (最 具体 ) 的 地 址 前 缓 。 





组 织 0 
200.23.16.0/23 
| “向 我 发 送 以 
组 织 2 200.23.16.0/20 
200.23.20.0/23 —— | | 开始 的 任何 东西 
组 织 7 Sa O E 
200.23.30.0/23° 
“向 我 发 送 以 
199.31.0.0/16 因特网 
组 织 1 或 200.23.18.0/23 
200,23.18,0/23— 开始 的 任何 东西 ” 
— _ ISPs-R-Us Sammaan -Ë 
=> afi i 





| 图 4-22 ISPs-R-Us 具有 到 组 织 1 的 一 条 更 具体 的 路 由 





一 个 地 址 的 剩余 32 -x 比特 可 认为 是 用 于 区 分 该 组 织 内 部 设备 的 ， 其 中 的 所 有 设备 具 
有 相同 的 网 络 前 缀 。 当 该 组 织 内 部 的 路 由 器 转发 分 组 时 ， 才 会 考虑 这 些 比特 。 这 些 较 低 阶 
比特 可 能 (或 可 能 不 ) 具有 另外 的 子 网 结构 ， 如 前 面 所 讨论 的 那样 。 例 如 ， 假 设 某 CIDR 
化 的 地 址 a. b. c. d/21 的 前 21 比特 定义 了 该 组 织 的 网 络 前 级 ， 它 对 该 组 织 中 所 有 主机 的 IP 
地 址 来 说 是 共同 的 。 其 余 的 11 比特 标识 了 该 组 织 内 的 主机 。 该 组 织 的 内 部 结构 可 以 采用 
这 样 的 方式 ， 使 用 最 右边 的 11 比特 在 该 组 织 中 划分 子 网 ， 就 像 前 面 所 讨论 的 那样 。 例 如 ， 
a. b. c. d/24 可 能 表示 该 组 织 内 的 特定 子 网 。 

在 CIDR 被 采用 之 前 ， 卫 地 址 的 网 络 部 分 被 限制 为 长 度 为 8、16 或 24 比特 ， 这 是 一 种 
称 为 分 类 编 址 (classful addressing) 的 编 址 方案 ， 这 是 因为 具有 8、16 和 24 比特 子 网 地 址 
的 子 网 分 别 被 称 为 A、B 和 C 类 网 络 。 一 个 全 地 址 的 网 络 部 分 正好 为 1、2 或 3 字 节 的 要 
R, 已 经 在 支持 数量 迅速 增加 的 具有 小 规模 或 中 等 规模 子 网 的 组 织 方面 出 现 了 问题 。 一 个 
C (/24) 子 网 仅 能 容纳 多 达 2° -2 =254 (2 =256， 其 中 的 两 个 地 址 预 留用 于 特殊 用 
R) 台 主 机 ， 这 对 于 许多 组 织 来 说 太 小 了 。 然 而 一 个 B 类 (/16) 子 网 可 支持 多 达 65 534 
台 主 机 ， 又 太 大 了 。 在 分 类 编 址 方法 下 ， 比 方 说 一 个 有 2000 台 主 机 的 组 织 通常 被 分 给 一 
个 B 类 (/16) 地 址 。 这 就 导致 了 B 类 地 址 空间 的 迅速 损耗 以 及 所 分 配 的 地 址 空间 的 利用 
率 低下 。 例 如 ， 为 具有 2000 台 主 机 的 组 织 分 配 一 个 B 类 地 址 ， 就 具有 足以 支持 多 达 
65 534 个 接口 的 地 址 空间 ， 剩 下 的 超过 63 000 个 地 址 却 不 能 被 其 他 组 织 使 用 。 

如 果 还 不 提 及 另 一 种 类 型 的 下 地 址 , 即 IP 广播 地 址 255. 255. 255. 2355 ， 那 将 是 我 们 
的 玻 漏 。 当 一 台 主 机 发 出 一 个 目的 地 址 为 255. 255. 255. 255 的 数据 报时 ， 该 报 文 会 交付 给 
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同一 个 网 络 中 的 所 有 主机 。 路 由 器 也 会 有 选择 地 向 邻近 的 子 网 转发 该 报 文 (虽然 它们 通常 
不 这 样 做 ) 。 

现在 我 们 已 经 详细 地 学 习 了 IP 编 址 ， 需 要 知道 主机 或 子 网 最 初 是 如 何 得 到 它们 的 地 
址 的 。 我 们 先 看 一 个 组 织 是 如 何 为 其 设备 得 到 一 个 地 址 块 的 ， 然 后 再 看 一 个 设备 ( 如 一 台 
主机 ) 是 如 何 从 某 组 织 的 地 址 块 中 分 配 到 一 个 地 址 的 。 

1. 获取 一 块 地 址 

为 了 获取 一 块 P 地 址 用 于 一 个 组 织 的 子 网 内 ， 某 网 络 管理 员 也 许 首先 会 与 他 的 ISP 联 
系 ， 该 ISP 可 能 会 从 已 分 给 它 的 更 大 地 址 块 中 提供 一 些 地 址 。 例 如 ， 该 ISP 也 许 自己 已 被 
分 配 了 地 址 块 200. 23. 16. 0/20。 该 ISP 可 以 依次 将 该 地 址 块 分 成 8 个 长 度 相等 的 连续 地 址 
块 ， 为 本 ISP 支持 的 最 多 达 8 个 组 织 中 的 一 个 分 配 这 些 地 址 块 中 的 一 块 ， 如 下 所 示 。 (为 
了 便于 查看 ， 我 们 已 将 这 些 地 址 的 网 络 部 分 加 了 下 划 线 。) 








ISP 的 地 址 块 200, 23. 16. 0/20 11001000 00010111 00010000 00000000 
组 织 0 200. 23. 16. 0/23 11001000 00010111 00010000 00000000 
组 织 1 200. 23. 18. 0/23 11001000 00010111 00010010 00000000 
组 织 2 200. 23. 20. 0/23 11001000 00010111 00010100 00000000 
组 织 7 200. 23. 30. 0/23 11001000 00010111 00011110 00000000 





尽管 从 一 个 ISP 获取 一 组 地 址 是 一 种 得 到 一 块 地 址 的 方法 ， 但 这 不 是 唯一 的 方法 。 显 
然 ， 必 须 还 有 一 种 方法 供 ISP 本 身 得 到 一 块 地 址 。 是 否 有 一 个 全 球 性 的 权威 机 构 ， 它 具有 
管理 P 地 址 空间 并 向 各 ISP 和 其 他 组 织 分 配 地 址 块 的 最 终 责任 呢 ? 的 确 有 一 个 ! IP 地 址 
由 因特网 名 字 和 编号 分 配 机 构 (Internet Corporation for Assigned Names and Numbers, 
ICANN) [ICANN 2016] 管理 ， 管 理 规则 基于 [ RFC 7020 ] 。 非 营利 的 ICANN 组 织 [NTIA 
1998] 的 作用 不 仅 是 分 配 地 址 ， 还 管理 DNS 根 服务 器 。 它 还 有 一 项 容易 引起 争论 的 工 
作 ， 即 分 配 域名 与 解决 域名 纷争 。ICANN 向 区 域 性 因特网 注册 机 构 (如 ARIN, RIPE, 
APNIC 和 LACNIC) 分 配 地 址 ， 这 些 机 构 一 起 形成 了 ICANN 的 地 址 支持 组 织 . [ASO- 
ICANN 2016 ] ， 处 理 本 区 域内 的 地 址 分 配 / 管 理 。 

2. 获取 主机 地 址 : 动态 主机 配置 协议 

某 组 织 一 旦 获得 了 一 块 地 址 ， 它 就 可 为 本 组 织 内 的 主机 与 路 由 器 接口 逐个 分 配 卫 地 
址 。 系 统管 理 员 通常 手工 配置 路 由 器 中 的 他 地 址 (常常 在 远程 通过 网 络 管理 工具 进行 配 
置 ) 。 主 机 地 址 也 能 手动 配置 ， 但 是 这 项 任务 目前 更 多 的 是 使 用 动态 主机 配置 协议 (Dy- 
namic Host Configuration, DHCP) [RFC 2131] 来 完成 。DHCP 允许 主机 自动 获取 (被 分 
W) 一 个 IP 地 址 。 网 络 管理 员 能 够 配置 DHCP， 以 使 某 给 定 主机 每 次 与 网 络 连接 时 能 得 到 
一 个 相同 的 IP 地址 ， 或 者 某 主 机 将 被 分 配 一 个 临时 的 IP 地 址 (temporary IP address) ， 每 
次 与 网 络 连接 时 该 地 址 也 许 是 不 同 的 。 除 了 主机 IP 地 址 分 配 外 ，DHCP 还 允许 一 台 主 机 得 
知 其 他 信息 ， 例 如 它 的 子 网 掩 码 、 它 的 第 一 跳 路 由 器 地 址 ( 常 称 为 默认 网 关 ) 与 它 的 本 地 
DNS 服务 器 的 地 址 。 

由 于 DHCP 具有 将 主机 连接 进 一 个 网 络 的 网 络 相关 方面 的 自动 能 力 ， 故 它 又 常 被 称 为 
即 插 即 用 协议 (plug-and-play protocol) 或 零 配置 (zeroconf) 协议 。 这 种 能 力 对 于 网 络 管 
理 员 来 说 非常 有 吸引 力 ， 否 则 他 将 不 得 不 手工 执行 这 些 任务 ! DHCP 还 广泛 地 用 于 住宅 因 特 
网 接 人 网 、 企 业 网 与 无 线 局 域 网 中 ， 其 中 的 主机 频繁 地 加 入 和 离开 网 络 。 例 如 ， 考 虑 一 个 学 
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生 带 着 便携 机 从 宿舍 到 图 书馆 再 到 教室 。 很 有 可 能 在 每 个 位 置 这 个 学 生 将 连接 到 一 个 新 的 子 
网 ， 因 此 在 每 个 位 置 都 需要 一 个 新 的 卫 地 址 。DHCP 是 适合 这 种 情形 的 理想 方法 ， 因 为 有 许 
多 用 户 来 来 往往 ， 并 且 仅 在 有 限 的 时 间 内 需要 地 址 。DHCP 的 即 插 即 用 能 力 的 价值 是 显然 的 ， 
因为 下 列 情况 是 不 可 想象 的 : 系统 管理 员 在 每 个 位 置 能 够 重新 配置 便携 机 ， 并 且 少 数学 生 
(除了 那些 上 过 计算 机 网 络 课程 的 学 生 ) 让 专家 人 工地 配置 他 们 的 便携 机 。 

DHCP 是 一 个 客户 - 服务 器 协议 。 客 户 通常 是 新 到 达 的 主机 ， 它 要 获得 包括 自身 使 用 
的 IP 地 址 在 内 的 网 络 配置 信息 。 在 最 简单 场合 下 ， 每 个 子 网 〈 在 图 4-20 的 编 址 意义 下 ) 
将 具有 一 台 DHCP 服务 器 。 如 果 在 某 子 网 中 没有 服务 器 ， 则 需要 一 个 DHCP 中 继 代理 〈 通 
常 是 一 台 路 由 器 ) ， 这 个 代理 知道 用 于 该 网 络 的 DHCP 服务 器 的 地 址 。 图 4-23 显示 了 连接 
到 子 网 223. 1. 2/24 的 一 台 DHCP 服务 器 ， 具 有 一 台 提 供 中 继 代理 服务 的 路 由 器 ， 它 为 连 
接 到 子 网 223. 1. 1/24 和 223. 1. 3/24 的 到 达 客 户 提供 DHCP 服务 。 在 我 们 下 面 的 讨论 中 ， 
将 假定 DHCP 服务 器 在 该 子 网 上 是 可 供 使 用 的 。 


DHCP 
服务 器 


A 223.1.2.5 


223.1.1.4 223.1.2.9 





223.1.3.27 


到 达 的 


< DHCP 客 户 
i 223.1.2.2 


223.1.3.1 223.1.3.2 
图 4-23 DHCP 客户 和 服务 器 


对 于 一 台新 到 达 的 主机 而 言 ， 针 对 图 4-23 所 示 的 网 络 设置 ，DHCP 协议 是 一 个 4 个 步 
又 的 过 程 ， 如 图 4-24 中 所 示 。 在 这 幅 图 中 ，yiaddr (表示 “你 的 因特网 地 址 ”之 意 ) 指示 
分 配给 该 新 到 达 客 户 的 地 址 。 
这 4 个 步骤 是 : 
e DHCP 服务 器 发 现 。 一 台新 到 达 的 主机 的 首要 任务 是 发 现 一 个 要 与 其 交互 的 DHCP 
服务 器 。 这 可 通过 使 用 DHCP 发 现 报 文 (DHCP discover message) 来 完成 ， 客 户 在 
UDP 分 组 中 向 端口 67 发 送 该 发 现 报 文 。 该 UDP 分 组 封装 在 一 个 卫 数据 报 中 。 但 是 
这 个 数据 报应 发 给 谁 呢 ? 主机 甚至 不 知道 它 所 连接 网 络 的 IP 地 址 ， 更 不 用 说 用 于 该 
网 络 的 DHCP 服务 器 地 址 了 。 在 这 种 情况 下 ，DHCP 客户 生成 包含 DHCP 发 现 报 文 的 
IP 数据 报 ， 其 中 使 用 广播 目的 地 址 255. 255. 255. 255 并 且 使 用 “本 主机 ” 源 IP 地 址 
0.0.0.0, DHCP 客户 将 该 IP 数据 报 传递 给 链 路 层 ， 链 路 层 然后 将 该 帧 广播 到 所 有 与 
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该 子 网 连接 的 节点 (我们 将 在 6. 4 节 中 涉及 链 路 层 广 播 的 细节 ) 。 


DHCP 服 务 器 
223.1.2.5 
a 到 达 的 客户 





DHCP 提 供 
sre: 223.1.2.5, 67 
dest: 255,255.255.255,68 


Lifetime: 3600 secs 


;  |DHCP server ID: 223.1.2.5 
:  |Lifetime: 3600 secs 


DHCP ACK 





v 
时 间 时 间 
图 4-24 DHCP 客户 - 服务 器 交互 


DHCP 服务 器 提供 。DHCP 服务 器 收 到 一 个 DHCP 发 现 报 文 时 ， 用 DHCP 提供 报 
3X (DHCP offer message) 向 客户 做 出 响应 ， 该 报 文 向 该 子 网 的 所 有 节点 广播 ， 仍 
然 使 用 IP 广播 地 址 255. 255. 255. 255 (你 也 许 要 思考 一 下 这 个 服务 器 为 何 也 必须 
采用 广播 ) 。 因 为 在 子 网 中 可 能 存在 几 个 DHO 服务 器 ， 该 客户 也 许 会 发 现 它 处 于 
能 在 几 个 提供 者 之 间 进 行 选 择 的 优越 位 置 。 每 台 服 务 器 提供 的 报 文 包含 有 收 到 的 
发 现 报 文 的 事务 了 、 向 客户 推荐 的 IP 地 址 、 网 络 掩 码 以 及 IP 地 址 租用 期 (ad- 
dress lease time) BI IP 地 址 有 效 的 时 间 量 。 服 务 器 租用 期 通常 设置 为 几 小 时 或 几 
K [Droms 2002 | 。 

DHCP 请 求 。 新 到 达 的 客户 从 一 个 或 多 个 服务 器 提供 中 选择 一 个 ， 并 向 选中 的 服 
务 器 提供 用 DHCP 请 求 报 文 (DHCP request message) 进行 响应 ， 回 显 配置 的 
参数 。 

DHCP ACK。 服 务 器 用 DHCP ACK 报 文 (DHCP ACK message) 对 DHCP 请 求 报 文 
进行 响应 ， 证 实 所 要 求 的 参数 。 


一 且 客 户 收 到 DHCP ACK 后 ， 交 互 便 完成 了 ， 并 且 该 客户 能 够 在 租用 期 内 使 用 DHCP 


ABE: KEPE 225 





分 配 的 IP 地 址 。 因 为 客户 可 能 在 该 租用 期 超时 后 还 希望 使 用 这 个 地 址 ， 所 以 DHCP 还 提 
供 了 一 种 机 制 以 允许 客户 更 新 它 对 一 个 IP 地 址 的 租用 。 

从 移动 性 角度 看 ，DHCP 确实 有 非常 严重 的 缺陷 。 因 为 每 当 节 点 连 到 一 个 新 子 网 ， 要 
从 DHCP 得 到 一 个 新 的 卫 地 址 ， 当 一 个 移动 节点 在 子 网 之 间 移 动 时 ， 就 不 能 维持 与 远程 
应 用 之 间 的 TCP 连接 。 在 第 6 章 中 ,我们 将 研究 移动 让 ， 它 是 一 种 对 IP 基础 设施 的 扩展 ， 
人 允许 移动 节点 在 网 络 之 间 移 动 时 使 用 其 单一 永久 的 地 址 。 有 关 DHCP 的 其 他 细节 可 在 
[Droms 2002] 与 [dhe 2016] 中 找到 。 一 个 DHCP 的 开放 源码 参考 实现 可 从 因特网 系统 
协会 [ISC 2016] 得 到 。 


4.3.4 网 络 地 址 转换 


讨论 了 有 关 因 特 网 地 址 和 IPv4 数据 报 格式 后 ， 我 们 现在 可 清楚 地 认识 到 每 个 P 使 能 
的 设备 都 需要 一 个 IP 地 址 。 随 着 所 谓 小 型 办 公 室 、 家 庭 办 公 室 (Small Office, Home 
Office, SOHO) 子 网 的 大 量 出 现 ， 看 起 来 意味 着 每 当 一 个 SOHO 想 安装 一 个 LAN 以 互联 
多 人 台 机 器 时 ， 需 要 ISP 分 配 一 组 地 址 以 供 该 SOHO 的 所 有 四 设备 (包括 电话 、 平 板 电 脑 、 
游戏 设备 、IP TV、 打印机 等 ) 使 用 。 如 果 该 子 网 变 大 了 ， 则 需要 分 配 一 块 较 大 的 地 址 。 
但 如 果 ISP 已 经 为 SOHO 网 络 的 当前 地 址 范围 分 配 过 一 块 连续 地 址 该 怎么 办 呢 ? 并 且 ， 家 
庭 主 人 一 般 要 (或 应 该 需要 ) 首先 知道 的 管理 卫 地 址 的 典型 方法 有 哪些 呢 ? 幸运 的 是 ， 
有 一 种 简单 的 方法 越 来 越 广泛 地 用 在 这 些 场合 : 网 络 地 址 转换 (Network Address Transla- 
tion, NAT) [RFC 2663; RFC 3022; Huston 2004; Zhang 2007; Cisco NAT 2016], 

图 4-25 显示 了 一 台 NAT 使 能 路 由 器 的 运行 情况 。 位 于 家 中 的 NAT 使 能 的 路 由 器 有 一 
个 接口 ， 该 接口 是 图 4-25 中 右 侧 所 示 家 庭 网 络 的 一 部 分 。 在 家 庭 网 络 内 的 编 址 就 像 我 们 
在 上 面 看 到 的 完全 一 样 ， 其 中 的 所 有 4 个 接口 都 具有 相同 的 网 络 地 址 10. 0. 0/24。 地 址 空 
间 10. 0. 0.0/8 是 在 [RFC 1918] 中 保留 的 三 部 分 IP 地 址 空间 之 一 ， 这 些 地 址 用 于 如 图 4- 
25 中 的 家 庭 网 络 等 专用 网 络 (private network) 或 具有 专用 地 址 的 地 域 (realm with private 
address) 。 具 有 专用 地 址 的 地 域 是 指 其 地 址 仅 对 该 网 络 中 的 设备 有 意义 的 网 络 。 为 了 明白 
它 为 什么 重要 ， 考 虑 有 数 十 万 家 庭 网 络 这 样 的 事实 , 许多 使 用 了 相同 的 地 址 空间 
10. 0. 0. 0/24, 在 一 个 给 定 家 庭 网 络 中 的 设备 能 够 使 用 10. 0. 0.0/24 编 址 彼此 发 送 分 组 。 
然而 ， 转 发 到 家 庭 网 络 之 外 进入 更 大 的 全 球 因 特 网 的 分 组 显然 不 能 使 用 这 些 地 址 (或 作为 
源 地 址 ， 或 作为 目的 地 址 ) ， 因 为 有 数 十 万 的 网 络 使 用 着 这 块 地 址 。 这 就 是 说 ，10. 0. 0. 0 
24 地 址 仅 在 给 定 的 网 络 中 才 有 意义 。 但 是 如 果 专 用 地 址 仪 在 给 定 的 网 络 中 才 有 意义 的 话 ， 
当 向 或 从 全 球 因特网 发 送 或 接收 分 组 时 如 何 处 理 编 址 问题 呢 ， 地 址 在 何 处 才 必 须 是 唯一 的 
呢 ? 答案 在 于 理解 NAT。 

NAT 使 能 路 由 器 对 于 外 部 世界 来 说 甚至 不 像 一 台 路 由 器 。 相 反 NAT 路 由 器 对 外 界 的 
行为 就 如 同一 个 具有 单一 P 地 址 的 单一 设备 。 在 图 4-25 中 ， 所 有 离开 家 庭 路 由 器 流向 更 
大 因特网 的 报 文 都 拥有 一 个 源 卫 地 址 138. 76. 29.7， 且 所 有 进入 家 庭 的 报 文 都 拥有 同一 个 
目的 IP 地 址 138. 76. 29.7。 从 本 质 上 讲 ，NAT 使 能 路 由 器 对 外 界 隐藏 了 家 庭 网 络 的 细节 。 
(另外 ， 你 也 许 想 知道 家 庭 网 络 计算 机 是 从 哪儿 得 到 其 地 址 ， 路 由 器 又 是 从 哪儿 得 到 它 的 
单一 IP 地 址 的 。 在 通常 的 情况 下 ， 答 案 是 相同 的 ， 即 DHCP! 路 由 器 从 ISP 的 DHCP 服务 
器 得 到 它 的 地 址 ， 并 且 路 由 器 运行 一 个 DHCP 服务 器 ， 为 位 于 NAT-DHCP 路 由 器 控制 的 家 
庭 网 络 地 址 空间 中 的 计算 机 提供 地 址 。) 
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10.0.03 
图 4-25 网络 地 址 转换 


如 果 从 广域网 到 达 NAT 路 由 器 的 所 有 数据 报 都 有 相同 的 目的 全 地址 (特别 是 对 NAT 
路 由 器 广域网 一 侧 的 接口 ) ， 那 么 该 路 由 器 怎样 知道 它 应 将 某 个 分 组 转发 给 哪个 内 部 主机 
We? 技巧 就 是 使 用 NAT 路 由 器 上 的 一 张 NAT 转换 表 (NAT translation table) ， 并 且 在 表 项 
中 包含 了 端口 号 及 其 卫 地 址 。 

考虑 图 4-25 中 的 例子 。 假 设 一 个 用 户 坐 在 家 庭 网 络 主机 10. 0. 0. 1 后 ， 请 求 IP 地 址 为 
128. 119. 40. 186 的 某 台 Web 服务 器 (端口 80) 上 的 一 个 Web 页 面 。 主 机 10.0.0.1 为 其 
指派 了 (任意 ) 源 端口 号 3345 并 将 该 数据 报 发 送 到 LAN 中 。NAT 路 由 器 收 到 该 数据 报 ， 
为 该 数据 报 生 成 一 个 新 的 源 端口 号 5001， 将 源 IP 替代 为 其 广域网 一 侧 接口 的 IP 地 址 
138. 76. 29. 7， 且 将 源 端 口 3345 更 换 为 新 端口 5001。 当 生成 一 个 新 的 源 端口 号 时 ，NAT 路 
由 器 可 选择 任意 一 个 当前 未 在 NAT 转换 表 中 的 源 端口 号 。 (注意 到 因为 端口 号 字段 为 16 
ERK, NAT 协议 可 支持 超过 60 000 个 并 行使 用 路 由 器 广域网 一 侧 单个 P 地 址 的 连接 !) 
路 由 器 中 的 NAT 也 在 它 的 NAT 转换 表 中 增加 一 表 项 。Web 服务 器 并 不 知道 刚 到 达 的 包含 
HTTP 请 求 的 数据 报 已 被 NAT 路 由 器 进行 了 改装 ， 它 会 发 回 一 个 响应 报 文 ， 其 目的 地 址 是 
NAT 路 由 器 的 中 地址， 其 目的 端口 是 5001。 当 该 报 文 到 达 NAT 路 由 器 时 ， 路 由 器 使 用 目 
的 卫 地 址 与 目的 端口 号 从 NAT 转换 表 中 检索 出 家 庭 网 络 浏览 器 使 用 的 适当 IP 地 址 
(10.0.0.1) 和 目的 端口 号 (3345 ) 。 于 是 ， 路 由 器 重 写 该 数据 报 的 目的 卫 地 址 与 目的 端 
口号 ， 并 向 家 庭 网 络 转发 该 数据 报 。 

NAT 在 近年 来 已 得 到 了 广泛 的 应 用 。 但 是 NAT 并 非 没 有 贬低 者 。 首 先 ， 有 人 认为 端 
口号 是 用 于 进程 寻 址 的 ， 而 不 是 用 于 主机 寻 址 的 。 这 种 违规 用 法 对 于 运行 在 家 庭 网 络 中 的 
服务 器 来 说 确实 会 引起 问题 ， 因 为 正如 我 们 在 第 2 章 所 见 ， 服 务 器 进程 在 周知 端口 号 上 等 
待人 请 求 ， 并 且 P2P 协议 中 的 对 等 方 在 充当 服务 器 时 需要 接受 人 连接 。 对 这 些 问 题 的 技术 
解决 方案 包括 NAT 穿越 (NAT traversal) 工具 [RFC 5389] 和 通用 即 插 即 用 (Universal 
Plug and Play, UPnP), UPnP 是 一 种 允许 主机 发 现 和 配置 邻近 NAT 的 协议 [UPnP Forum 
2016] 。 

其 次 ,纯粹 的 体系 结构 者 提出 了 更 为 “原理 性 的 ”反对 NAT 的 意见 。 这 时 ， 关 注 焦 
点 在 于 路 由 器 是 指 第 三 层 (MAKE) 设备 ， 并 且 应 当 处 理 只 能 达到 网 络 层 的 分 组 。NAT 
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违反 主机 应 当 直接 彼此 对 话 这 个 原则 ， 没 有 干涉 节点 修改 IP 地 址 ， 更 不 用 说 端口 号 。 但 
不 管 喜欢 与 否 ，NAT 已 成 为 因特网 的 一 个 重要 组 件 ， 成 为 所 谓 中 间 盒 [Sekar 2011] ， 它 
运行 在 网 络 层 并 具有 与 路 由 器 十 分 不 同 的 功能 。 中 间 盒 并 不 执行 传统 的 数据 报 转发 ， 而 是 
执行 诸如 NAT、 流 量 流 的 负载 均衡 、 流 量 防火 墙 (参见 下 面 的 插入 框 内 容 ) 等 功能 。 我 
们 将 在 随后 的 4. 4 节 学 习 的 通用 转发 范例 ， 除 了 传统 的 路 由 器 转发 外 ， 还 允许 一 些 这 样 的 
中 间 盒 功能 ， 从 而 以 通用 、 综 合 的 方式 完成 转发 。 


检查 数据 报 : 防火 墙 和 入 侵 检 测 系统 


假定 你 被 赋予 了 管理 家 庭 网 络 、 部 门 网 络 、 大 学 网 络 或 公司 网 络 的 任务 。 知 道 你 网 
| 络 耳 地 址 范围 的 攻击 者 ， 能 够 方便 地 在 此 范围 中 发 送 IP 数据 报 进行 寻 址 。 这 些 数据 报 
| 能 够 做 各 种 不 正当 的 事情 ， 包 括 用 ping 搜索 和 端口 扫描 形成 你 的 网 络 图 ， 用 恶意 分 组 使 
易 受 攻击 的 主机 崩溃 ， 扫 描 你 网 络 中 服务 器 上 的 开放 TCP/UDP 端口 ， 并 且 通 过 在 分 组 
中 带 有 恶意 软件 来 感染 主机 。 作 为 网 络 管理 员 ， 你 准备 做 些 什么 来 将 这 些 能 够 在 你 的 网 
络 中 发 送 恶意 分 组 的 坏 家 伙 拒 之 门 外 呢 ? 对 抗 恶意 分 组 攻击 的 两 种 流行 的 防御 措施 是 防 
火 墙 和 入 侵 检 测 系统 (IDS), 

作为 一 名 网 络 管理 员 ， 你 可 能 首先 尝试 在 你 的 网 络 和 因特网 之 间 安 装 一 台 防 火 墙 。 
| (今天 大 多 数 接 入 路 由 器 具有 防火 墙 能 力 。) 防火 墙 检 查 数据 报 和 报 文 段 首部 字段 ， 拒 绝 
| 可 疑 的 数据 报 进入 内 部 网 络 。 例如， 一 台 防 火 墙 可 以 被 配置 为 阻挡 所 有 的 ICMP 回 显 请 
求 分 组 (参见 5.6 节 ) ， 从 而 防止 了 攻击 者 横 跨 你 的 耳 地 址 范围 进行 传统 的 端口 扫描 。 
防火 墙 也 能 基于 源 和 目的 IP 地 址 以 及 端口 号 阻挡 分 组 。 此 外 ， 防 火 墙 能 够 配置 为 跟踪 
TCP 连接 ， 仅 许可 属于 批准 连接 的 数据 报 进入 。 | 

IDS 能 够 提供 另 一 种 保护 措施 。IDS 通常 位 于 网 络 的 边界 ， 执 行 “深度 分 组 检查 ”， 
不 仅 检 查 数 据 报 ( 包括 应 用 层 数 据 ) 中 的 首部 字段 ， 而 且 检 查 其 有 效 载荷 。IDS 具有 一 
个 分 组 特征 数据 库 ， 这 些 特 征 是 已 知 攻击 的 一 部 分 。 随 着 新 攻击 的 发 现 ， 该 数据 库 自 动 
更 新 特征 。 当 分 组 通过 IDS 时 ，IDS 试图 将 分 组 的 首部 字段 和 有 效 载荷 与 其 特征 数据 库 
中 的 特征 相 匹 配 。 如 果 发 现 了 这 样 的 一 种 匹配 ， 就 产生 一 个 告警 。 入 侵 防 止 系 统 (IPS) 
与 IDS 类 似 ， 只 是 除了 产生 告警 外 还 实际 阻挡 分 组 。 在 第 8 章 中 ,我 们 将 更 为 详细 地 研 
究 防 火 墙 和 IDS。 

防火 墙 和 IDS 能 够 全 面 保 护 你 的 网 络 免 受 所 有 攻击 吗 ? 答案 显然 是 否定 的 ， 因 为 攻 
| 击 者 继续 寻找 特征 还 不 能 匹配 的 新 攻击 方法 。 但 是 防火 墙 和 传统 的 基于 特征 的 IDS 在 保 
| 护 你 的 网 络 不 受 已 知 攻击 入 侵 方面 是 有 用 的 。 














4.3.5 IPv6 


在 20 世纪 90 年 代 早期 ， 因 特 网 工程 任务 组 就 开始 致力 于 开发 一 种 替代 IPv4 的 协议 。 
该 努力 的 首要 动机 是 以 下 现实 : 由 于 新 的 子 网 和 下 节点 以 惊人 的 增长 率 连 到 因特网 上 
(并 被 分 配 唯 一 的 他 地址)，32 比特 的 全 地 址 空间 即将 用 尽 。 为 了 应 对 这 种 对 大 IP 地 址 
空间 的 需求 ， 开 发 了 一 种 新 的 全 协议 ， 即 IPv6。IPv6 的 设计 者 还 利用 这 次 机 会 ， 在 IPv4 
积累 的 运行 经 验 基 础 上 加 进 和 强化 了 IPv4 的 其 他 方面 。 
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IPv4 地 址 在 什么 时 候 会 被 完全 分 配 完 (因此 没有 新 的 网 络 再 能 与 因特网 相连 ) 是 一 
个 相当 有 争议 的 问题 。IETF 的 地 址 寿命 期 望 工作 组 的 两 位 负责 人 分 别 估 计 地 址 将 于 2008 
年 和 2018 年 用 完 [Solensky 1996]。 在 2011 年 2 H, IANA 向 一 个 区 域 注册 机 构 分 配 完了 
未 分 配 IPv4 地 址 的 最 后 剩余 地 址 池 。 这 些 注 册 机 构 在 它们 的 地 址 池 中 还 有 可 用 的 IPv4 地 
址 , 一 旦 用 完 这 些 地 址 ， 从 中 央 池 中 将 再 也 分 配 不 出 更 多 的 可 用 地 址 块 了 [ Huston 
2011a]。IPv4 地 址 空间 耗 尽 的 近期 调研 以 及 延长 该 地 址 空间 的 寿命 所 采取 的 步骤 见 
[ Richter 2015 ] 。 

尽管 在 20 世纪 90 年 代 中 期 对 IPv4 地 址 耗 尽 的 估计 表明 ，IPv4 地 址 空间 耗 尽 的 期 限 还 
有 可 观 的 时 间 ， 但 人 们 认识 到 ， 如 此 大 规模 地 部 署 一 项 新 技术 将 需要 可 观 的 时 间 ， 因 此 研 
发 版 本 6 (IPv6) [RFC 2460] 的 工作 开始 了 [RFC 1752], (一 个 经 常 问 的 问题 是 : 





IPv5 出 了 什么 情况 ?人们 最 初 预想 ST-2 协议 one 

将 成 为 IPv5， 但 ST-2 后 来 被 舍弃 了 。) AX 号 一 一 = 

IPv6 的 优秀 信息 来 源 见 [Huitema 1998], 版 本 “流量 类 型 流标 答 
1. IPv6 数据 报 格式 有 效 载荷 长 度 下 一 个 首部 RA 
IPv6 数据 报 的 格式 如 图 4-26 所 示 。 Wi 
IPv6 中 引入 的 最 重要 的 变化 显示 在 其 数据 目的 地 址 《128 比特 ) 

报 格式 中 : 数据 


© 扩大 的 地 址 容量 。IPv6 将 IP 地 址 长 度 
从 32 比特 增加 到 128 比特 。 这 就 确保 
全 世界 将 不 会 用 尽 IP 地 址 。 现 在 ， 地 球 上 的 每 个 沙砾 都 可 以 用 卫 地 址 寻 址 了 。 除 
了 单 播 与 多 播 地 址 以 外 ，IPv6 还 引入 了 一 种 称 为 任 播 地 址 (anycast address) 的 新 
型 地 址 ， 这 种 地 址 可 以 使 数据 报 交付 给 一 组 主机 中 的 任意 一 个 。( 例如 ， 这 种 特性 
可 用 于 回 一 组 包含 给 定 文档 的 镜像 站 点 中 的 最 近 一 个 发 送 HTTP GET 报 文 。) 

© 简化 高 效 的 40 字 节 首部 。 如 下 面 讨 论 的 那样 ， 许 多 IPv4 字段 已 被 舍弃 或 作为 选 
项 。 因 而 所 形成 的 40 字 节 定 长 首部 允许 路 由 器 更 快 地 处 理 IP 数据 报 。 一 种 新 的 
选项 编码 允许 进行 更 灵活 的 选项 处 理 。 

© 流标 签 。IPv6 有 一 个 难以 捉摸 的 流 (flow) 定义 。RFC 2460 中 描述 道 ， 该 字段 可 
用 于 “给 属于 特殊 流 的 分 组 加 上 标签 ， 这些 特殊 流 是 发 送 方 要 求 进行 特殊 处 理 的 
流 ， 如 一 种 非 默认 服务 质量 或 需要 实时 服务 的 流 ”。 例 如 ， 音 频 与 视频 传输 就 可 能 
被 当 作 一 个 流 。 男 一 方面 ， 更 为 传统 的 应 用 (如 文件 传输 和 电子 邮件 ) 就 不 可 能 
被 当 作 流 。 由 高 优先 权 用 户 (如 某 些 为 使 其 流量 得 到 更 好 服务 而 付费 的 用 户 ) 承 
载 的 流量 也 有 可 能 被 当 作 一 个 流 。 然 而 ，IPv6 的 设计 者 显然 已 预见 到 最 终 需 要 能 
够 区 分 这 些 流 ， 即 使 流 的 确切 含义 还 未 完全 确定 。 

如 上 所 述 ， 比 较 图 4-26 与 图 4-16 就 可 看 出 ，IPv6 数据 报 的 结构 更 简单 、 更 高 效 。 以 

下 是 在 IPv6 中 定义 的 字段 。 

© 版 本 。 该 4 比特 字段 用 于 标识 P 版 本 号 。 毫 不 奇怪 ，IPY6 将 该 字段 值 设 为 6。 注 
意 到 将 该 字段 值 置 为 4 并 不 能 创建 一 个 合法 的 IPv4 数据 报 。 (如 果 这 样 的 话 ， 事 
情 就 简单 多 了 ， 参 见 下 面 有 关 从 IPv4 向 IPv6 迁移 的 讨论 。) 

© 流量 类 型 。 该 8 比特 字段 与 我 们 在 IPv4 中 看 到 的 TOS 字段 的 含义 相似 。 

。 流标 签 。 如 上 面 讨 论 过 的 那样 ， 该 20 比特 的 字段 用 于 标识 一 条 数据 报 的 流 ， 能 够 


图 4-26 IPv6 数据 报 格式 
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对 一 条 流 中 的 某 些 数据 报 给 出 优先 权 , 或 者 它 能 够 用 来 对 来 自 某 些 应 用 (例如 了 全 
话音 ) 的 数据 报 给 出 更 高 的 优先 权 ， 以 优 于 来 自 其 他 应 用 (例如 SMTP 电子 邮件 ) 
的 数据 报 。 

© 有 效 载荷 长 度 。 该 16 比特 值 作为 一 个 无 符号 整数 ， 给 出 了 IPv6 数据 报 中 跟 在 定 长 

的 40 字 节 数据 报 首部 后 面 的 字 节 数量 。 
© 下 一 个 首部 。 该 字段 标识 数据 报 中 的 内 容 (数据 字段 ) 需要 交付 给 哪个 协议 (如 
TCP 或 UDP) 。 该 字段 使 用 与 IPv4 首部 中 协议 字段 相同 的 值 。 

跳 限 制 。 转 发 数据 报 的 每 台 路 由 器 将 对 该 字段 的 内 容 减 1。 如 果 跳 限制 计数 达到 
0， 则 该 数据 报 将 被 丢弃 。 
源 地 址 和 目的 地 址 。IPv6 128 比特 地 址 的 各 种 格式 在 RFC 4291 中 进行 了 描述 。 
© 数据 。 这 是 IPv6 数据 报 的 有 效 载荷 部 分 。 当 数据 报到 达 目 的 地 时 ， 该 有 效 载 荷 就 
从 了 下 数据 报 中 移出 ， 并 交 给 在 下 一 个 首部 字段 中 指定 的 协议 处 理 。 

以 上 讨论 说 明了 IPv6 数据 报 中 包括 的 各 字段 的 用 途 。 将 图 4-26 中 的 IPv6 数据 报 格式 
与 图 4-16 中 的 IPv4 数据 报 格式 进行 比较 ， 我 们 就 会 注意 到 ， 在 IPv4 数据 报 中 出 现 的 几 个 
字段 在 IPv6 数据 报 中 已 不 复 存在 : 

e 分 片 /重新 组 装 。IPv6 不 允许 在 中 间 路 由 器 上 进行 分 片 与 重新 组 装 。 这 种 操作 只 能 

在 源 与 目的 地 执行 。 如 果 路 由 器 收 到 的 IPv6 数据 报 因 太 大 而 不 能 转发 到 出 链 路 上 
的 话 ， 则 路 由 器 只 需 丢 掉 该 数据 报 ， 并 向 发 送 方 发 回 一 个 “分 组 太 大 ”的 ICMP 
差错 报 文 即 可 ( 见 5.6 节 ) 。 于 是 发 送 方 能 够 使 用 较 小 长 度 的 IP 数据 报 重 发 数据 。 
分 片 与 重新 组 装 是 一 个 耗 时 的 操作 ， 将 该 功能 从 路 由 器 中 删除 并 放 到 端 系统 中 ， 
大 大 加 快 了 网 络 中 的 IP 转发 速度 。 

e 首部 检验 和 。 因 为 因特网 层 中 的 运输 层 (如 TCP 与 UDP) 和 数据 链 路 层 (如 以 太 
网 ) 协议 执行 了 检验 操作 ， 卫 设计 者 大 概 觉 得 在 网 络 层 中 具有 该 项 功能 实 属 多 
余 ， 所 以 将 其 去 除 。 再 次 强调 的 是 ， 快 速 处 理 中 分 组 是 关注 的 重点 。 在 4.3.1 节 
中 我 们 讨论 IPv4 时 讲 过 ， 由 于 IPv4 首部 中 包含 有 一 个 TTL 字 段 (类 似 于 IPv6 中 的 
跳 限制 字段 ) ， 所 以 在 每 台 路 由 器 上 都 需要 重新 计算 IPv4 首部 检验 和 。 就 像 分 片 
与 重新 组 装 一 样 ， 在 IPv4 中 这 也 是 一 项 耗 时 的 操作 。 

。 选项 。 选 项 字段 不 再 是 标准 卫 首 部 的 一 部 分 了 。 但 它 并 没有 消失 ， 而 是 可 能 出 现 
在 IPv6 首部 中 由 “下 一 个 首部 ”指出 的 位 置 上 。 这 就 是 说 ， 就 像 TCP 或 UDP 协 
议 首部 能 够 是 IP 分 组 中 的 “下 一 个 首部 ”一 样 ， 选 项 字段 也 能 是 “下 一 个 首部 ”。 
删除 选项 字段 使 得 IP 首部 成 为 定 长 的 40 字 节 。 

2. 从 IPv4 到 IPv6 的 迁移 


既然 我 们 已 了 解 了 IPv6 的 技术 细节 ， 那 么 我 们 考虑 一 个 非常 实际 的 问题 : 基于 IPv4 
的 公共 因特网 如 何 迁 移 到 IPv6 WE? 问题 是 ， 虽 然 新 型 IPv6 使 能 系统 可 做 成 向 后 兼容 ， 即 
能 发 送 、 路 由 和 接收 IPv4 数据 报 ， 但 已 部 署 的 具有 IPv4 能 力 的 系统 却 不 能 够 处 理 IPv6 数 
据 报 。 可 以 采用 以 下 几 种 方法 [Huston 2011b; RFC 4213], 

一 种 可 选 的 方法 是 宣布 一 个 标志 日 ， 即 指定 某 个 日 期 和 时 间 ， 届 时 因特网 的 所 有 机 器 
都 关机 并 从 IPv4 升级 到 IPv6。 上 次 重大 的 技术 迁移 (为 得 到 可 靠 的 运输 服务 ， 从 使 用 
NCP 迁移 到 使 用 TCP) 出 现在 差不多 35 年 以 前 。 即 使 回 到 那 时 [RFC 801 | 因特网 
很 小 上 且 仍 然 由 少数 “奇才 ”管理 着 ， 人 们 也 会 认识 到 选择 这 样 一 个 标志 日 是 不 可 行 的 。 一 
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个 涉及 数 十 亿 台 机 器 的 标志 日 现在 更 是 不 可 想象 的 。 

在 实践 中 已 经 得 到 广泛 采用 的 IPv4 到 IPv6 迁移 的 方法 包括 建 隧道 (tunneling) 
[RFC 4213], 。 除 了 IPv4 到 IPv6 迁移 之 外 的 许多 其 他 场合 的 应 用 都 具有 建 隧 道 的 关键 概 
念 ， 包 括 在 第 7 章 将 涉及 的 全 IP 蜂窝 网 络 中 也 得 到 广泛 使 用 。 建 隧道 依据 的 基本 思想 
如 下 : 假定 两 个 IPv6 节点 (如 图 4-27 中 的 B 和 E) 要 使 用 IPv6 数据 报 进行 交互 ， 但 它 
们 是 经 由 中 间 IPv4 路 由 器 互联 的 。 我 们 将 两 台 IPv6 路 由 器 之 间 的 中 间 IPv4 路 由 器 的 集 
合 称 为 一 个 隧道 (tunnel), ， 如 图 4-27 所 示 。 借 助 于 隧道 ， 在 隧道 发 送 端 的 IPv6 节点 
(如 B) 可 将 整个 IPv6 数据 报 放 到 一 个 IPv4 数据 报 的 数据 (有 效 载荷 ) 字段 中 。 于 是 ， 
该 IPv4 数据 报 的 地 址 设 为 指向 隧道 接收 端的 IPv6 节点 (在 此 例 中 为 EE) ， 再 发 送 给 隧道 
中 的 第 一 个 节点 (在 此 例 中 为 C)。 隧 道中 的 中 间 IPv4 路 由 器 在 它们 之 间 为 该 数据 报 提 
供 路 由 ， 就 像 对 待 其 他 数据 报 一 样 ， 完 全 不 知道 该 Pv4 数据 报 自身 就 含有 一 个 完整 的 
IPv6 数据 报 。 隧 道 接收 端的 IPv6 节点 最 终 收 到 该 IPv4 数据 报 ( 它 是 该 IPv4 数据 报 的 目 
的 地 ) ， 并 确定 该 IPv4 数据 报 含有 一 个 IPv6 数据 报 (通过 观察 在 IPv4 数据 报 中 的 协议 
号 字段 是 41. [RFC 4213], ， 指 示 该 IPv4 有 效 载荷 是 IPv6 数据 报 ) ， 从 中 取出 IPv6 数据 
报 ， 然 后 再 为 该 IPv6 数据 报 提 供 路 由 ， 就 好 像 它 是 从 一 个 直接 相连 的 Pv6 邻居 那里 接 
收 到 该 v6 数据 报 一 样 。 





B 到 C: IPv4 D 到 E: IPv4 
(封装 IPv6) (封装 IPv6) 
图 4-27 EŠ 


在 结束 本 节 前 需要 说 明 的 是 ， 尽 管 采 用 IPv6 最 初 表现 为 一 个 缓慢 启动 的 过 程 【 Lawton 
2001; Huston 2008b ] ， 但 势头 已 经 有 了 。NIST [NIST IPv6 2015] 报告 称 ， 超 过 三 分 之 一 
的 美国 政府 二 级 域名 是 支持 IPv6 的 。 在 客户 端 ， 谷 歌 报告 称 访问 谷歌 服务 的 客户 仅 有 8% 
使 用 了 IPv6 [Google IPv6 2015]。 但 其 他 最 近 统 计 结 果 指 出 [ Czyz 2014], IPv6 的 采用 正 
在 加 速 。 诸 如 UP 使 能 的 电话 和 其 他 便携 式 设备 的 激增 ， 为 IPv6 的 更 广泛 部 署 提供 了 新 的 
推动 力 。 欧 洲 的 第 三 代 合作 计划 [3GPP 2016] 已 规定 了 IPv6 为 移动 多 媒体 的 标准 编 址 
方案 。 
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我 们 能 从 IPv6 经 验 中 学 到 的 重要 一 课 是 ， 要 改变 网 络 层 协议 是 极其 困难 的 。 自 从 20 
世纪 90 年 代 早期 以 来 ， 有 许多 新 的 网 络 层 协议 被 鼓吹 为 因特网 的 下 一 次 重大 革命 ， 但 这 
些 协议 中 的 大 多 数 至 今 为 止 只 取得 了 有 限 突破 。 这 些 协议 包括 Pv6、 多 播 协议 、 资 源 预 贸 
协议 ， 其 中 后 面 两 个 协议 的 讨论 可 在 本 书 的 在 线 补充 材料 中 找到 。 在 网 络 层 中 引信 新 的 协 
议 的 确 如 同 替 换 一 幢 房 子 的 基石 ， 即 在 不 拆 掉 整 幢 房子 (或 至 少 临 时 重新 安置 房屋 住户 ) 
的 情况 下 是 很 难 完成 上 述 工 作 的 。 男 一 方面 ， 因 特 网 却 已 见证 了 在 应 用 层 中 新 协议 的 快速 
部 署 。 典 型 的 例子 当然 有 Web、 即 时 讯息 、 流 媒体 、 分 布 式 游戏 和 各 种 形式 的 社交 媒体 。 
引入 新 的 应 用 层 协 议 就 像 给 一 幢 房 子 重新 刷 一 层 漆 ， 这 是 相对 容易 做 的 事 ， 如 果 你 选择 了 
一 个 好 看 的 颜色 ， 邻 居 将 会 照搬 你 的 选择 。 总 之 ， 未 来 我 们 肯定 会 看 到 因特网 网 络 层 发 生 
改变 ， 但 这 种 改变 将 比 应 用 层 慢 得 多 。 


4.4 通用 转发 和 SDN 


在 4.2.1 节 中 ,我 们 注意 到 因特网 路 由 器 的 转发 决定 传统 上 仅仅 基于 分 组 的 目的 地 
址 。 然 而 ， 在 前 一 节 中 ,我们 也 已 经 看 到 执行 许多 第 三 层 功 能 的 中 间 盒 有 了 大 量 发 展 。 
NAT 盒 重 写 首部 IP 地 址 和 端口 号 ; 防火 墙 基 于 首部 字段 值 阻拦 流量 或 重 定 向 分 组 以 进行 
其 他 处 理 ， 如 深度 分 组 检测 (DPI) 。 负 和 载 均衡 器 将 请 求 某 种 给 定 服务 (例如 一 个 HTTP 请 
求 ) 的 分 组 转发 到 提供 该 服务 的 服务 器 集合 中 的 一 个 。[ RFC 3234] 列 出 了 许多 常用 中 间 
盒 功 能 。 

第 二 层 交 换 机 和 第 三 层 路 由 器 等 中 间 盒 [Qazi 2013] 的 剧 增 ， 而 且 每 种 都 有 自己 特殊 
的 硬件 、 软 件 和 管理 界面 ， 无 疑 给 许多 网 络 操作 员 带 来 了 十 分 头疼 的 大 麻烦 。 然 而 ， 近 期 
软件 定义 网 络 的 进展 已 经 预示 并 且 正 在 提出 一 种 统一 的 方法 ， 以 一 种 现代 、 简 洁 和 综合 方 
式 ， 提 供 多 种 网 络 层 功 能 以 及 某 些 链 路 层 功 能 。 

回顾 4.2.1 节 将 基于 目的 地 转发 的 特征 总 结 为 两 个 步骤 : 查找 目的 地址 (“ 匹 
配 ”) ， 然 后 将 分 组 发 送 到 有 特定 输出 端口 的 交换 结构 (“动作 ” )。 我 们 现在 考虑 一 种 更 有 
意义 的 通用 “匹配 加 动作 ”范式 ， 其 中 能 够 对 协议 栈 的 多 个 首部 字段 进行 “匹配 ” ， 这 些 
首部 字段 是 与 不 同 层次 的 不 同 协议 相关 联 的 。 “动作 ”能 够 包括 : 将 分 组 转发 到 一 个 或 多 
个 输出 端口 (就 像 在 基于 目的 地 转发 中 一 样 )， 跨 越 多 个 通 向 服务 的 离开 接口 进行 负载 均 
衡 分 组 (就 像 在 负载 均衡 中 一 样 )， 重 写 首部 值 ( 就 像 在 NAT 中 一 样 ) ， 有 意识 地 阻挡 / 丢 
弃 某 个 分 组 (就 像 在 防火 墙 中 一 样 )， 为 进一步 处 理 和 动作 而 向 某 个 特定 的 服务 器 发 送 一 
个 分 组 (就 像 在 DPI 一样 ) ， 等 等 。 

在 通用 转发 中 ， 一 张 匹配 加 动作 表 将 我 们 在 4. 2. 1 节 中 看 到 的 基于 目的 地 的 转发 表 一 
般 化 了 。 因 为 能 够 使 用 网 络 层 和 /或 链 路 层 源 和 目的 地 址 做 出 转发 决定 ， 所 以 显示 在 图 4- 
28 中 的 转发 设备 更 为 准确 地 描述 为 “分 组 交换 机 ”而 不 是 第 三 层 “ 路 由 器 ”或 第 二 层 
“交换 机 ”。 因 此 ， 在 本 节 后 面部 分 以 及 5.5 节 中 ， 我们 将 这 些 设备 称 为 分 组 交换 机 ， 这 是 
在 SDN 文献 中 被 广泛 采用 的 术语 。 

图 4-28 显示 了 位 于 每 台 分 组 交换 机 中 的 一 张 匹 配 加 动作 表 ， 该 表 由 远程 控制 器 计算 、 
安装 和 更 新 。 我 们 注意 到 虽然 在 各 人 台 分 组 交换 机 中 的 控制 组 件 可 以 相互 作用 〈 例 如 以 类 似 
于 图 4-2 中 的 方式 ) ， 但 实践 中 通用 匹配 加 动作 能 力 是 通过 计算 、 安 装 和 更 新 这 些 表 的 远 
程控 制 器 实现 的 。 花 几 分钟 比 较 图 4-2、 图 4-3 和 图 4-28 ， 你 能 看 出 图 4-2 和 图 4-3 中 显示 
的 基于 目的 地 转发 与 图 4-28 中 显示 的 通用 转发 有 什么 相似 和 差异 吗 ? 








到 达 分 组 首部 中 的 值 





图 4-28 通用 转发 : 每 台 分 组 交换 机 包含 一 张 匹 配 加 动作 表 ， 该 表 是 由 远程 控制 器 计算 和 分 发 的 


我 们 后 续 对 通用 转发 的 讨论 将 基于 OpenFlow [ McKeown 2008; OpenFlow 2009; Casa- 
do 2014; Tourrilhes 2014], OpenFlow 是 一 个 得 到 高 度 认 可 和 成 功 的 标准 ， 它 已 经 成 为 匹配 
加 动作 转发 抽象 、 控 制 器 以 及 更 为 一 般 的 SDN 革命 等 概念 的 先驱 [Feamster 2013 ] 。 我 们 
将 主要 考虑 OpenFlow 1.0， 该 标准 以 特别 清晰 和 简明 的 方式 引入 了 关键 的 SDN 抽象 和 功 
能 。OpenFlow 的 后 继 版 本 根据 实现 和 使 用 获得 的 经 验 引 入 了 其 他 能 力 ; OpenFlow 标准 的 
当前 和 早期 版 本 能 在 [ONF 2016] 中 找到 。 
匹配 加 动作 转发 表 在 OpenFlow 中 称 为 流 表 (flow table) ， 它 的 每 个 表 项 包括 : 
e 首部 字段 值 的 集合 ， 人 分 组 将 与 之 匹配 。 与 基于 目的 地 转发 的 情况 一 样 ， 基 于 硬件 
匹配 在 TCAM 内 存 中 执行 得 最 为 迅速 (TCAM 内 存 中 可 能 有 上 百 万 条 地 址 表 项 ) 
[ Bosshart 2013 ] 。 匹 配 不 上 流 表 项 的 分 组 将 被 丢弃 或 发 送 到 远程 控制 器 做 更 多 处 
理 。 在 实践 中 ， 为 了 性 能 或 成 本 原因 ， 一 个 流 表 可 以 由 多 个 流 表 实 现 【Bosshart 
2013 ] ， 但 我 们 这 里 只 关注 单一 流 表 的 抽象 。 

e 计数 器 集合 〈 当 分 组 与 流 表 项 匹配 时 更 新 计数 器 ) 。 这 些 计数 器 可 以 包括 已 经 与 该 
表 项 匹配 的 分 组 数量 ， 以 及 自从 该 表 项 上 次 更 新 以 来 的 时 间 。 

e 当 分 组 匹配 流 表 项 时 所 采取 的 动作 集合 。 这 些 动作 可 能 将 分 组 转发 到 给 定 的 输出 端 
口 ， 丢 弃 该 分 组 、 复 制 该 分 组 和 将 它们 发 送 到 多 个 输出 端口 ， 和 /或 重 写 所 选 的 首 
部 字段 。 

我 们 将 在 4. 4.1 节 和 4.4.2 节 中 分 别 更 为 详细 地 探讨 匹配 和 动作 。 我 们 将 学 习 每 台 分 
组 交换 机 网 络 范围 的 匹配 规则 集合 是 如 何 用 来 实现 多 种 多 样 的 功能 的 ， 包括 4.4.3 节 中 的 
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路 由 选择 、 第 二 层 交 换 路 由 、 防 火 墙 、 负 载 均衡 、 虚 拟 网 络 等 等 。 在 结束 时 ， 我 们 注意 到 
流 表 本 质 上 是 一 个 API， 通 过 这 种 抽象 每 台 分 组 交换 机 的 行为 能 被 编程 ; 我 们 将 在 4. 4. 3 
节 中 看 到 ， 通 过 在 网 络 分 组 交换 机 的 集合 中 适当 地 编程 /配置 这 些 表 ， 网 络 范围 的 行为 能 
被 类 似 地 编程 [Casado 2014 | 。 


4.4.1 匹配 


图 4-29 显示 了 11 个 分 组 首部 字段 和 入 端口 ID, 该 四 能 被 OpenFlow 1.0 中 的 匹配 加 
动作 规则 所 匹配 。 前 面 1. 5. 2 节 讲 过 ， 到 达 一 台 分 组 交换 机 的 一 个 链 路 层 (第 二 层 ) 帧 将 
包含 一 个 网 络 层 〈 第 三 层 ) 数据 报 作 为 其 有 效 载荷 ， 该 载荷 通常 依次 将 包含 一 个 运输 层 
(第 四 层 ) 报 文 段 。 第 一 个 观察 是 ，OpenFlow 的 匹配 抽象 允许 对 来 自 三 个 层次 的 协议 首部 
所 选择 的 字段 进行 匹配 〈 因 此 相当 勇敢 地 违反 了 我 们 在 1.5 节 中 学 习 的 分 层 原则 ) 。 因 为 
我 们 还 没有 涉及 链 路 层 ， 用 如 下 的 说 法 也 就 足够 了 : 显示 在 图 4-29 中 的 源 和 目的 MAC 地 
址 是 与 帧 的 发 送 和 接收 接口 相关 联 的 链 路 层 地 址 ; 通过 基于 以 太 网 地 址 而 不 是 卫 地 址 进 
行 转 发 ， 我 们 看 到 OpenFlow 使 能 的 设备 能 够 等 价 于 路 由 器 (第 三 层 设 备 ) 转发 数据 报 以 
及 交换 机 (第 二 层 设 备 ) 转发 帧 。 以 太 网 类 型 字段 对 应 于 较 高 层 协议 (例如 到 )， 利用 该 
字段 分 解 该 帧 的 载荷 ， 并 且 VLAN 字段 与 所 谓 虚拟 局 域 网 相关 联 ， 我 们 将 在 第 6 章 中 学 习 
VLAN, OpenFlow 1. 0 规范 中 匹配 的 12 个 值 在 最 近 的 OpenFlow 规范 中 已 经 增加 到 41 个 
[ Bosshart 2014 ] 。 





链 路 层 网 络 层 运输 层 
图 4-29 OpenFlow 1. 0 流 表 的 分 组 匹配 字段 


和 端口 是 指 分 组 交换 机 上 接收 分 组 的 输入 端口 。 在 4.3.1 节 中 ,我们 已 经 讨论 过 该 分 
AY IP 源 地 址 、 卫 目的 地 址 、 人 P 协议 字段 和 IP 服务 类 型 字段 。 运 输 层 源 和 目的 端口 号 字 
段 也 能 匹配 。 

流 表 项 也 可 以 有 通配符 。 例 如 ， 在 一 个 流 表 中 IP 地 址 128.119. * . * 将 匹配 其 地 址 的 
前 16 比特 为 128. 119 的 任何 数据 报 所 对 应 的 地 址 字段 。 每 个 流 表 项 也 具有 相应 的 优先 权 。 
如 果 一 个 分 组 匹配 多 个 流 表 项 ， 选 定 的 匹配 和 对 应 的 动作 将 是 其 中 有 最 高 优先 权 的 那个 。 

最 后 ,我 们 观察 到 并 非 一 个 P 首部 中 的 所 有 字段 都 能 被 匹配 。 例 如 OpenFlow 并 不 允 
许 基于 TTL 字段 或 数据 报 长 度 字段 的 匹配 。 为 什么 有 些 字段 允许 匹配 ， 而 有 些 字段 不 允许 
We? 毫 无 疑问 ， 与 功能 和 复杂 性 有 关 。 选 择 一 种 抽象 的 “艺术 ”是 提供 足够 的 功能 来 完成 
某 种 任务 (在 这 种 情况 下 是 实现 、 配 置 和 管理 宽泛 的 网 络 层 功能 ， 以 前 这 些 一 直 是 通过 各 
种 各 样 的 网 络 层 设备 来 实现 的 ) ， 不 必用 如 此 详尽 和 一 般 性 的 “ 超 负荷 ”抽象 ， 这 种 抽象 
LAZAR EEN ANAS AT FA], Butler Lampson 有 过 著名 的 论述 [Lampson 1983 ] ; 

在 一 个 时 刻 做 一 件 事 ， 将 它 做 好 。 一 个 接口 应 当 停 获 一 个 抽象 的 最 低 限 度 的 要 件 。 不 
要 进行 一 般 化 ， 一 般 化 通常 是 错误 的 。 

考虑 到 OpenFlow 的 成 功 ， 人 们 能 够 推测 它 的 设计 者 的 确 很 好 地 选择 了 抽象 技术 。 
OpenFlow 匹配 的 更 多 细节 能 够 在 [OpenFlow 2009; ONF 2016] 中 找到 。 
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4.4.2 动作 


如 图 4-28 中 所 见 ， 每 个 流 表 项 都 有 零 个 或 多 个 动作 列表 ， 这 些 动作 决定 了 应 用 于 与 
流 表 项 匹配 的 分 组 的 处 理 。 如 果 有 多 个 动作 ， 它 们 以 在 表 中 规定 的 次 序 执 行 。 
其 中 最 为 重要 的 动作 可 能 是 : 
© 转发 。 一 个 人 分 组 可 以 转发 到 一 个 特定 的 物理 输出 端口 ， 广 播 到 所 有 端口 (分 组 到 
达 的 端口 除外 ) ， 或 通过 所 选 的 端口 集合 进行 多 播 。 该 分 组 可 能 被 封装 并 发 送 到 用 
于 该 设备 的 远程 控制 器 。 该 控制 器 则 可 能 (或 可 能 不 ) 对 该 分 组 采取 某 些 动作 ， 
包括 安装 新 的 流 表 项 ， 以 及 可 能 将 该 分 组 返回 给 该 设备 以 在 更 新 的 流 表 规 则 集合 下 
进行 转发 。 
© 丢弃 。 没 有 动作 的 流 表 项 表明 某 个 匹配 的 分 组 应 当 被 丢弃 。 
© 修改 字段 。 在 分 组 被 转发 到 所 选 的 输出 端口 之 前 ,分 组 首部 10 个 字段 (图 4-29 中 
显示 的 除 IP 协议 字段 外 的 所 有 第 二 、 三 、 四 层 的 字段 ) 中 的 值 可 以 重 写 。 


4.4.3 匹配 加 动作 操作 中 的 OpenFlow 例子 


在 已 经 考虑 了 通用 转发 的 匹配 和 动作 组 件 后 ， 我 们 在 图 4-30 显示 的 样本 网 络 场景 中 
将 这 些 想法 拼装 在 一 起 。 该 网 络 具 有 6 AEHL (hl、h2、h3、h4、h5 和 h6) 以 及 3 台 分 
组 交换 机 (sl 、s2 和 s3)， 每 台 交 换 机 具有 4 个 本 地 接口 (编号 1 到 4) 。 我 们 将 考虑 一 些 
希望 实现 的 网 络 范围 的 行为 ， 在 sl, 、s2 和 s3 中 的 流 表 项 需要 实现 这 种 行为 。 





图 4-30 具有 3 台 分 组 交换 机 、6 台 主 机 和 1 台 OpenFlow 控制 器 的 OpenFlow 匹配 加 动作 网 络 


第 一 个 例子 : 简单 转发 

作为 一 个 非常 简单 的 例子 ,假定 希 望 的 转发 行为 是 : 来 自 h5 或 h6 发 往 h3 或 h4 的 分 
组 从 s3 转发 到 s1 ， 然 后 从 sl 转发 到 s2 (完全 避免 使 用 s3 和 s2 之 间 的 链 路 ) 。 在 sl 中 的 
流 表 项 将 是 : 


sl 流 表 ( 例 1) 
匹配 动作 
Ingress Port =1; IP Sre=10.3. *. +; IP Dst=10.2. +. + Forward (4) 








MAB: RHF A 235 





当然 ， 我 们 也 需要 在 s3 中 有 一 个 流 表 项 ， 使 得 该 数据 报 从 h5 或 h6 经 过 出 接口 3 转发 
到 sl: 
3 流 表 ( 例 1) 


匹配 动作 
IP Sre =10.3. *. *; IP Dst=10.2. *. * Forward (3) 











最 后 ， 我 们 也 需要 在 s2 中 有 一 个 流 表 项 来 完成 第 一 个 例子 ， 使 得 从 sl 到 达 的 数据 报 
转发 到 它们 的 目的 主机 h3 或 h4。 








s2 流 表 〈 例 1) 
匹配 动作 
Ingress Port =2; IP Dst =10.2.0.3 Forward (3) 
Ingress Port =2; IP Dst =10.2.0.4 Forward (4) 


第 二 个 例子 : 负载 均衡 

作为 第 二 个 例子 ， 我 们 考虑 一 个 负载 均衡 的 场景 ， 其 中 来 自 h3 发 往 10, 1. * . * 的 数 
据 报 经 过 sl 和 s2 之 间 的 直接 链 路 转发 ， 与 此 同时 来 自 h4 发 往 10.1. x. * 的 数据 报 经 过 
s2 和 s3 (于 是 从 s3 到 sl) 之 间 的 链 路 转发 。 注 意 到 这 种 行为 不 能 通过 基于 人 P 的 目的 地 转 
发 取得 。 在 这 种 情况 下 ， 在 s2 中 的 流 表 项 将 是 : 








s2 流 表 ( 例 2) 
匹配 动作 
Ingress Port =3; IP Dst=10. 1. *. * Forward (2) 
Ingress Port =4; IP Dst=10. 1. *. * Forward (1) - 


在 sl 中 需要 流 表 项 将 从 s2 收 到 的 数据 报 转发 到 hl 或 2; 在 s3 中 需要 流 表 项 将 接口 
4 上 从 82 收 到 的 数据 报 经 过 接口 3 转发 到 sl1 。 考 虑 是 否 能 在 sl 和 s3 中 配置 这 些 流 表 项 。 

第 三 个 例子 : 充当 防火 墙 

作为 第 三 个 例子 ,我 们 考虑 一 个 防火 墙 场景 ， 其 中 82 仅 硕 望 〈 在 它 的 任何 接口 上 ) 
接收 来 自 与 33 相连 的 主机 所 发 送 的 流量 。 








s2 流 表 ( 例 3) 
匹配 动作 
IP Src =10.3. *. *; IP Dst=10.2.0.3 Forward (3) 
IP Sre = 10.3. *. * ; IP Dst=10.2.0.4 Forward (4) 


MRE s2 的 流 表 中 没有 其 他 表 项 ， 则 仅 有 来 自 10. 3. +. * 的 流量 将 被 转发 到 与 s2 相 
连 的 主机 。 

尽管 我 们 这 里 仅 考 虑 了 几 种 基本 场景 ,但 通用 转发 的 多 样 性 和 优势 显而易见 。 在 课 后 
习题 中 ,我 们 将 探讨 流 表 如 何 用 来 生成 许多 不 同 的 逻辑 行为 ， 包 插 使 用 相同 分 组 交换 机 和 
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链 路 物理 集合 的 虚拟 网 络 ， 即 两 个 或 多 个 逻辑 上 分 离 的 网 络 (每 个 网 络 有 它们 自己 的 独立 
和 截然 不 同 的 转发 行为 )。 在 5.5 节 中 ， 当 学 习 SDN 控制 器 时 ， 我们 将 再 次 考察 流 表 ， 其 
中 SDN 控制 器 计算 和 分 发 流 表 ， 协 议 用 于 在 分 组 交换 机 和 它 的 控制 器 之 间 进 行 通 信 。 


4.5 小 结 


在 本 章 中 ， 我 们 讨论 了 网 络 层 的 数据 平面 (data plane) 功能 ， 即 每 台 路 由 器 的 如 下 
功能 : 决定 到 达 路 由 器 的 输入 链 路 之 一 的 分 组 如 何 转发 到 该 路 由 器 的 输出 链 路 之 一 。 

我 们 从 仔细 观察 路 由 器 的 内 部 操作 开始 ， 学 习 输 入 和 输出 端口 功能 ， 以 及 基于 目的 地 
的 转发 、 路 由 器 的 内 部 交换 机 制 、 分 组 排队 管理 等 等 。 我 们 涉及 传统 的 卫 转发 (其 中 转 
发 基于 数据 报 的 目的 地 址 进行 ) 和 通用 转发 (其 中 转发 和 其 他 功能 可 以 使 用 数据 报 首部 中 
的 几 个 不 同 的 字段 值 来 进行 ) ， 并 且 看 到 了 后 一 种 方法 的 多 种 用 途 。 我 们 还 详细 地 学 习 了 
IPv4 和 IPv6 协议 以 及 因特网 编 址 ， 并 对 此 有 了 更 深入 、 更 敏锐 和 更 有 趣 的 发 现 。 

借助 于 新 得 到 的 对 网 络 层 数 据 平面 的 理解 ， 我 们 现在 准备 着 手 学 习 第 5 章 中 的 网 络 层 
控制 平面 。 


课 后 习题 和 问题 





4.1 节 

RI. 我 们 回顾 在 本 书 中 使 用 的 某 些 术 语 。 前 面 讲 过 运输 层 的 分 组 名 字 是 报 文 段 ， 数 据 链 路 层 的 分 组 名 字 
是 帧 。 网 络 层 的 分 组 名 字 是 什么 ? 前 面 讲 过 路 由 器 和 链 路 层 交 换 机 都 被 称 为 分 组 交换 机 。 路 由 器 与 
链 路 层 交 换 机 间 的 根本 区 别 是 什么 ? 

R2. 我 们 注意 到 网 络 层 功能 可 被 大 体 分 成 数据 平面 功能 和 控制 平面 功能 。 数 据 平面 的 主要 功能 是 什么 ? 
控制 平面 的 主要 功能 呢 ? 

R3. 我 们 对 网 络 层 执行 的 转发 功能 和 路 由 选择 功能 进行 区 别 。 路 由 选择 和 转发 的 主要 区 别 是 什么 ? 

R4. 路 由 器 中 转发 表 的 主要 作用 是 什么 ? 

RS. 我 们 说 过 网 络 层 的 服务 模型 “定义 发 送 主机 和 接收 主机 之 间 端 到 端 分 组 的 传送 特性 ” 。 因 特 网 的 网 
络 层 的 服务 模型 是 什么 ? 就 主机 到 主机 数据 报 的 传递 而 论 ， 因 特 网 的 服务 模型 能 够 保证 什么 ? 

4.2 节 

R6. 在 4.2 节 中 ,我 们 看 到 路 由 器 通常 由 输入 端口 、 输 出 端口 、 交 换 结构 和 路 由 选择 处 理 器 组 成 。 其 中 
哪些 是 用 硬件 实现 的 ， 哪 些 是 用 软件 实现 的 ? 为 什么 ? 转 到 网 络 层 的 数据 平面 和 控制 平面 的 概念 ， 
哪些 是 用 硬件 实现 的 ， 哪 些 是 用 软件 实现 的 ? 为 什么 ? 

R7. 讨论 为 什么 在 高 速 路 由 器 的 每 个 输入 端口 都 存储 转发 表 的 影子 副本 。 

R8. 基于 目的 地 转发 意味 着 什么 ? 这 与 通用 转发 有 什么 不 同 〈 假 定 你 已 经 阅读 4.4 节 ， 两 种 方法 中 哪 种 
是 软件 定义 网 络 所 采用 的 )? 

R9. 假设 一 个 到 达 分 组 匹配 了 路 由 器 转发 表 中 的 两 个 或 更 多 表 项 。 采 用 传统 的 基于 目的 地 转发 ， 路 由 器 
用 什么 原则 来 确定 这 条 规则 可 以 用 于 确定 输出 端口 ， 使 得 到 达 的 分 组 能 交换 到 输出 端口 ? 

R10. 在 4.2 节 中 讨论 了 三 种 交换 结构 。 列 出 并 简要 讨论 每 一 种 交换 结构 。 哪 一 种 〈 如 果 有 的 话 ) 能 够 跨 
越 交 换 结构 并 行 发 送 多 个 分 组 ? 

R11. 描述 在 输入 端口 会 出 现 分 组 丢失 的 原因 。 描 述 在 输入 端口 如 何 消除 分 组 丢失 (不 使 用 无 限 大 缓存 区 ) 。 

R12. 描述 在 输出 端口 会 出 现 分 组 丢失 的 原因 。 通 过 提高 交换 结构 速率 ， 能 够 防止 这 种 丢失 吗 ? 

R13. 什么 是 HOL PASE? 它 出 现在 输入 端口 还 是 输出 端口 ? 
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R14. 在 4. 2 节 我 们 学 习 了 FIFO、 优 先 权 、 循 环 (RR) 和 加 权 公 平 排队 (WFQ) 分 组 调度 规则 。 这 些 排 
队 规 则 中 ， 哪 个 规则 确保 所 有 分 组 是 以 到 达 的 次 序 离开 的 ? 

R15. 举例 说 明 为 什么 网 络 操作 员 要 让 一 类 分 组 的 优先 权 超 过 另 一 类 分 组 的 。 

R16. RR 和 WFQ 分 组 调度 之 间 的 基本 差异 是 什么 ? 存在 RR 和 WFQ 将 表现 得 完全 相同 的 场合 吗 ? (提示 : 
考虑 WFQ 权重 。) 

4.3 节 

R17. 假定 主机 A 向 主机 B 发 送 封装 在 一 个 全 数据 报 中 的 TCP 报 文 段 。 当 主机 B 接收 到 该 数据 报时 ， 主 
机 了 中 的 网 络 层 怎样 知道 它 应 当 将 该 报 文 段 〈 即 数据 报 的 有 效 载 荷 ) 交 给 TCP 而 不 是 UDP 或 某 个 
其 他 东西 呢 ? 

R18. 在 卫 首 部 中 ， 哪 个 字段 能 用 来 确保 一 个 分 组 的 转发 不 超过 ON 台 路 由 器 ? 

R19. 前 面 讲 过 因特网 检验 和 被 用 于 运输 层 报 文 段 (分别 在 图 3-7 和 图 3-29 的 UDP 和 TCP 首部 中 ) 以 及 
网 络 层 数据 报 (图 4-16 的 人 * 首 部 中 )。 现 在 考虑 一 个 运输 层 报 文 段 封装 在 一 个 P 数据 报 中 。 在 报 
文 段 首部 和 数据 报 首部 中 的 检验 和 要 遍及 卫 数据 报 中 的 任何 共同 字 节 进行 计算 吗 ? 

R20. 什么 时 候 一 个 大 数据 报 分 割 成 多 个 较 小 的 数据 报 ? 较 小 的 数据 报 在 什么 地 方 装配 成 一 个 较 大 的 数据 报 ? 

R21. 路 由 器 有 IP 地址 吗 ? WRA, AELA? 

R22. IP 地 址 223. 1. 3.27 的 32 比特 二 进 制 等 价 形式 是 什么 ? 

R23. 考察 使 用 DHCP 的 主机 ， 获 取 它 的 全 地址、 网 络 掩 码 、 默 认 路 由 器 及 其 本 地 DNS 服务 器 的 IP 地 
址 。 列 出 这 些 值 。 

R24. 假设 在 一 个 源 主机 和 一 个 目的 主机 之 间 有 3 台 路 由 器 。 不 考虑 分 片 ， 一 个 从 源 主机 发 送 给 目的 主机 
的 IP 数据 报 将 通过 多 少 个 接口 ?为 了 将 数据 报 从 源 移动 到 目的 地 需要 检索 多 少 个 转发 表 ? 

R25. 假设 某 应 用 每 20ms 生成 一 个 40 字 节 的 数据 块 ， 每 块 封装 在 一 个 TCP 报 文 段 中 ，TCP 报 文 段 再 封装 
在 一 个 卫 数 据 报 中 。 每 个 数据 报 的 开销 有 多 大 ? 应 用 数据 所 占 百分比 是 多 少 ? 

R26. 假定 你 购买 了 一 个 无 线路 由 器 并 将 其 与 电缆 调制 解 调 器 相连 。 同 时 假定 ISP 动态 地 为 你 连接 的 设备 
( 即 你 的 无 线路 由 器 ) 分 配 一 个 下 地 址 。 还 假定 你 家 有 5 台 PC， 均 使 用 802. 11 以 无 线 方式 与 该 无 
线路 由 器 相连 。 怎 样 为 这 5 台 PC 分 配 IP 地 址 ? 该 无 线路 由 器 使 用 NAT 吗 ? 为 什么 ? 

R27. “路 由 聚合 ”一 词 意味 着 什么 ? 路 由 器 执行 路 由 聚合 为 什么 是 有 用 的 ? 

R28. “ 即 插 即 用 ”或 “ 零 配置 ”协议 意味 着 什么 ? 

R29. 什么 是 专用 网 络 地 址 ? 具有 专用 网 络 地 址 的 数据 报 会 出 现在 大 型 公共 因特网 中 吗 ? 解释 理由 。 

R30， 比 较 并 对 照 IPv4 和 IPv6 首部 字段 。 它 们 有 相同 的 字段 吗 ? 

R31. 有 人 说 当 IPv6 以 隧道 形式 通过 IPv4 路 由 器 时 ，IPv6 将 IPv4 隧道 作为 链 路 层 协 议 。 你 同意 这 种 说 法 
吗 ? 为 什么 ? 

4.4 节 

R32. 通用 转发 与 基于 目的 地 转发 有 何不 同 ? 

R33. 我 们 在 4. 1 节 遇 到 的 基于 目的 地 转发 与 在 4. 4 节 遇 到 的 OpenFlow 流 表 之 间 有 什么 差异 ? 

R34. 路 由 器 或 交换 机 的 “匹配 加 动作 ”意味 着 什么 ? 在 基于 目的 地 转发 的 分 组 交换 机 场合 中 ， 要 匹配 什 
么 并 采取 什么 动作 ? 在 SDN 的 场合 中 ， 举 出 3 个 能 够 被 匹配 的 字段 和 3 个 能 被 采取 的 动作 。 

R35. 在 全 数据 报 中 举 出 能 够 在 OpenFlow 1.0 通用 转发 中 “匹配 ”的 3 个 首部 字段 。 不 能 在 OpenFlow 中 
“匹配 ”的 3 个 正 数 据 报 首部 字段 是 什么 ? 


习题 


P1. 考虑 下 面 的 网 络 。 
a. 显示 路 由 器 A 中 的 转发 表 ， 使 得 目的 地 为 主机 H3 的 所 有 流量 都 通过 接口 3 转发 。 
b 写 出 路 由 器 A 中 的 转发 表 ， 使 得 从 Hl 发 往 主机 H3 的 所 有 流量 都 通过 接口 3 转发 ， 从 H2 REE 
机 H3 的 所 有 流量 都 通过 接口 4 转发 。( 提 示 : 这 是 一 个 技巧 性 的 问题 。) 


P2. 


P4. 
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假设 两 个 分 组 在 完全 相同 的 时 刻 到 达 一 台 路 由 器 的 两 个 不 同 输入 端口 。 同 时 假设 在 该 路 由 器 中 没有 

其 他 分 组 。 

a 假设 这 两 个 分 组 朝 着 两 个 不 同 的 输出 端口 转发 。 当 交换 结构 使 用 一 条 共享 总 线 时 ， 这 两 个 分 组 可 
能 在 相同 时 刻 通 过 该 交换 结构 转发 吗 ? 

b. 假设 这 两 个 分 组 朝 着 两 个 不 同 的 输出 端口 转发 。 当 交换 结构 使 用 经 内 存 交 换 时 ， 这 两 个 分 组 可 能 
在 相同 时 刻 通过 该 交换 结构 转发 吗 ? 

c 假设 这 两 个 分 组 朝 着 相同 的 输出 端口 转发 。 当 交换 结构 使 用 纵横 式 时 ， 这 两 个 分 组 可 能 在 相同 时 
刻 通过 该 交换 结构 转发 吗 ? 


. 在 4.2 节 中 ,我 们 注意 到 如 果 交 换 结构 速率 是 输入 线路 速率 的 n 倍 ， 其 最 大 的 排队 时 延 为 (n -1)D。 


假设 所 有 分 组 有 相同 长 度 ， 在 相同 时 刻 n 个 分 组 到 达 n 个 输出 端口 ， 同 时 所 有 个 分 组 要 转发 到 不 
同 的 输出 端口 。 对 于 内 存 、 总 线 和 纵横 式 交 换 结构 ， 一 个 分 组 的 最 大 时 延 是 多 少 ? 

考虑 下 列 交换 机 。 假 设 所 有 数据 报 具 有 相同 长 度 , 交换 机 以 一 种 分 时 辽 、 同 步 的 方式 运行 ， 在 一 个 
时 隙 中 一 个 数据 报 能 够 从 某 输入 端口 传送 到 某 输出 端口 。 其 交换 结构 是 纵横 式 的 ， 因 此 在 一 个 时 隙 
中 至 多 一 个 数据 报 能 够 传送 到 一 个 给 定 输出 端口 ， 但 在 一 个 时 隙 中 不 同 的 输出 端口 能 够 接收 到 来 自 
不 同 输入 端口 的 数据 报 ， 从 输入 端口 到 它们 的 输出 端口 传送 所 示 的 分 组 ， 所 需 的 时 隙 数量 最 小 是 多 
少 ? 此 时 假定 使 用 你 所 需要 的 任何 输入 排队 调度 方法 ( 即 此 时 没有 HOL 阻塞 )。 假 定 采用 你 能 够 设 
计 的 最 差 情 况 下 的 调度 方案 ， 是非 空 输入 队列 不 会 空 放 ， 所 需 的 时 际 数 量 最 大 蚌 多 少 ? 


p” mE 而 二 本 
-OE x HR 
g7 ey ivan — 


. 考虑 使 用 32 比特 主机 地 址 的 某 数据 报 网 络 。 假 定 一 台 路 由 器 具有 4 条 链 路 ， 编 号 为 0 ~3， 分 组 能 被 


转发 到 如 下 的 各 链 路 接口 ; 
目的 地 址 范围 链 路 接口 
11100000 00000000 00000000 00000000 


到 0 
11100000 00111111 11111111 11111111 
11100000 01000000 00000000 00000000 

到 1 
11100000 01000000 11111111 11111111 
11100000 01000001 00000000 00000000 

到 2 
11100001 O1111111 11111111 11111111 


其 他 3 


P9. 


P10. 


P11, 


P12. 


P13. 


P14, 
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a 提供 一 个 具有 5 个 表 项 的 转发 表 ， 使 用 最 长 前 缀 匹配 ， 转 发 分 组 到 正确 的 链 路 接口 。 
b. 描述 你 的 转发 表 是 如 何 为 具有 下 列 目的 地 址 的 数据 报 决 定 适当 的 链 路 接口 的 。 
11001000 10010001 01010001 01010101 
11100001 01000000 11000011 00111100 
11100001 10000000 00010001 01110111 


. 考虑 使 用 8 比特 主机 地 址 的 某 数据 报 网 络 。 假 定 一 台 路 由 器 使 用 最 长 前 缀 匹配 并 具有 下 列 转发 表 ， 


前 缀 匹配 接口 


对 这 4 个 接口 中 的 每 个 ,给 出 相应 的 目的 主机 地 址 的 范围 和 在 该 范围 中 的 地 址 数量 。 


. 考虑 使 用 8 比特 主机 地 址 的 数据 报 网 络 。 假 定 一 台 路 由 器 使 用 最 长 前 级 匹配 并 具有 下 列 转 发 表 : 
前 缀 匹配 接口 
1 0 
10 1 
111 2 
其 他 3 


对 这 4 个 接口 中 的 每 个 ， 给 出 相应 的 目的 主机 地 址 的 范围 和 在 该 范围 中 的 地 址 数量 。 


. 考虑 互联 3 个子 网 〈 子 网 1、 子 网 2 和 子 网 3) 的 一 台 路 由 器 。 假 定 这 3 个 子 网 的 所 有 接口 要 求 具有 


前 级 223. 1. 17/24。 还 假定 子 网 1 要 求 支持 多 达 60 个 接口 ， 子 网 2 要 求 支 持 多 达 90 个 接口 ， 子 网 3 
要 求 支持 多 达 12 个 接口 。 提 供 3 个 满足 这 些 限制 的 网 络 地 址 (形式 为 a.b. c d/x)。 

在 4.2.2 节 中 给 出 了 一 个 转发 表 (使 用 最 长 前 缀 匹配 ) 的 例子 。 使 用 a. b. c d/x 记 法 代替 二 进 制 字符 
串 记 法 ， 重 写 该 转发 表 。 

在 习题 P5 中 要 求 你 给 出 转发 表 (使 用 最 长 前 级 匹配 )。 使 用 a. b. c d/x 记 法 代替 二 进 制 字符 串 记 

法 ， 重 写 该 转发 表 。 

考虑 一 个 具有 前 缀 128. 119. 40. 128/26 的 子 网 。 给 出 能 被 分 配给 该 网 络 的 一 个 IP 地 址 (形式 为 

XXX. XXX. xxx. xxx) 的 例子 。 假 定 一 个 ISP 拥有 形式 为 128. 119. 40. 64/26 的 地 址 块 。 假 定 它 要 从 该 地 

址 块 生成 4 个 子 网 ， 每 块 具有 相同 数量 的 全 地址 。 这 4 个 子 网 (形式 为 a. b. c. d/x) 的 前 缀 是 什么 ? 

考虑 图 4-20 中 显示 的 拓扑 。( 在 12: 00 以 顺 时 针 开 始 ) 标记 具有 主机 的 3 个 子 网 为 网 络 A、B 和 C， 

标记 没有 主机 的 子 网 为 网 络 D、 忆 和 下。 

a 为 这 6 个 子 网 分 配 网 络 地 址 ， 要 满足 下 列 限 制 : 所 有 地 址 必须 从 214. 97. 254/23 起 分 配 ; FA A 
应 当 具 有 足够 地 址 以 支持 250 个 接口 ; 子 网 B 应 当 具 有 足够 地 址 以 支持 120 个 接口 ; 子 网 C 应 当 
具有 足够 地 址 以 支持 120 个 接口 。 当 然 ， 子 网 D、E 和 下 应 当 支 持 两 个 接口 。 对 于 每 个 子 网 ,分 
配 采 用 的 形式 是 a. b. c. d/x Ma. b. c. d/x ~e. f. g. h/yo 

b. 使 用 你 对 (a) 部 分 的 答案 ， 为 这 3 台 路 由 器 提供 转发 表 (使 用 最 长 前 缀 匹配 ) 。 

使 用 美国 因特网 编码 注册 机 构 (http://www. arin. net/whois) 的 whois 服务 来 确定 三 所 大 学 所 用 的 IP 

地 址 块 。whois 服务 能 被 用 于 确定 某 个 特定 的 IP 地 址 的 确定 地 理 位 置 吗 ? 使 用 www. maxmind. com 来 

确定 位 于 这 三 所 大 学 的 Web 服务 器 的 位 置 。 

考虑 向 具有 700 字 节 MTU 的 一 条 链 路 发 送 一 个 2400 字 节 的 数据 报 。 假 定 初 始 数据 报 标 有 标识 号 

422。 将 会 生成 多 少 个 分 片 ? 在 生成 相关 分 片 的 数据 报 中 各 个 字段 的 值 是 多 少 ? 
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P15. 


P16. 


P17. 


P18. 


P19, 


P20. 


P22. 


假定 在 源 主机 A 和 目的 主机 B 之 间 的 数据 报 被 限制 为 1500 字 节 (包括 首部 ) 。 假 设 IP 首部 为 20 F 

节 ， 要 发 送 一 个 5MB 的 MP3 文件 需要 多 少 个 数据 报 ? 解释 你 的 答案 是 如 何 计算 的 。 

考虑 在 图 4-25 中 建立 的 网 络 。 假 定 ISP 现在 为 路 由 器 分 配 地 址 24. 34. 112. 235， 家 庭 网 络 的 网 络 地 

址 是 192. 168. 1/24, 

a. 在 家 庭 网 络 中 为 所 有 接口 分 配 地 址 。 

b. 假定 每 台 主 机 具有 两 个 进行 中 的 TCP 连接， 所 有 都 是 针对 主机 128. 119. 40. 86 的 80 端口 的 。 在 
NAT 转换 表 中 提供 6 个 对 应 表 项 。 

假设 你 有 兴趣 检测 NAT 后 面 的 主机 数量 。 你 观察 到 在 每 个 卫 分 组 上 IP 层 顺序 地 标 出 一 个 标识 号 。 

由 一 台 主 机 生成 的 第 一 个 下 分 组 的 标识 号 是 一 个 随机 数 ， 后 继 IP 分 组 的 标识 号 是 顺序 分 配 的 。 假 

设 由 NAT 后 面 主机 产生 的 所 有 IP 分 组 都 发 往外 部 。 

a. 基于 这 个 观察 ， 假 定 你 能 够 俘获 由 NAT 向 外 部 发 送 的 所 有 分 组 ， 你 能 概要 给 出 一 种 简单 的 技术 
来 检测 NAT 后 面 不 同 主机 的 数量 吗 ? 评估 你 的 答案 。 

b 如 果 标 识 号 不 是 顺序 分 配 而 是 随机 分 配 的 ， 这 种 技术 还 能 正常 工作 吗 ? 评估 你 的 答案 。 

在 这 个 习题 中 ， 我 们 将 探讨 NAT 对 P2P 应 用 程序 的 影响 。 假 定 用 户 名 为 Arnold 的 对 等 方 通过 查询 

发 现 ， 用 户 名 为 Bernard 的 对 等 方 有 一 个 要 下 载 的 文件 。 同 时 假定 Bernard 和 Arnold 都 位 于 NAT 后 
。 尝 试 设计 一 种 技术 ， 使 得 Arnold 与 Bernard 创建 一 条 TCP 连接 ， 而 不 对 NAT 做 应 用 特定 的 配 

置 。 如 果 难 以 设计 这 样 的 技术 ， 试 讨论 其 原因 。 

考虑 显示 在 图 4-30 中 的 SDN OpenFlow 网 络 。 假 定 对 于 到 达 s2 的 数据 报 的 期 望 转发 行为 如 下 : 

o 来 自主 机 h5 或 h6 并 且 发 往 主 机 hl 或 h2 的 任何 数据 报应 当 通过 输出 端口 2 转发 到 输入 端口 1。 

© 来 自主 机 hl 或 h2 并 且 发 往 主机 hs 或 h6 的 任何 数据 报应 当 通 过 输出 端口 1 转发 到 输入 端口 2。 

o 任何 在 端口 1 或 2 到 达 并 且 发 往 主机 h3 或 h4 的 数据 报应 当 传递 到 特定 的 主机 。 

e 主机 h3 和 h4 应 当 能 够 向 彼此 发 送 数据 报 。 

详 述 实现 这 种 转发 行为 的 s2 中 的 流 表 项 。 

再 次 考虑 显示 在 图 4-30 中 的 SDN OpenFlow 网 络 。 假 定 在 s2 对 于 来 自主 机 h3 或 h4 的 数据 报 的 期 望 

转发 行为 如 下 : 

o 任何 来 自主 机 h3 并 且 发 往 主 机 hl 、h2 、h5 或 h6 的 数据 报应 当 在 网 络 中 以 顺 时 针 方向 转发 。 

o 任何 来 自主 机 h4 并 且 发 往 主机 hl h2, h5 或 h6 的 数据 报应 当 在 网 络 中 以 逆 时 针 方向 转发 。 

详 述 实现 这 种 转发 行为 的 s2 中 的 流 表 项 。 


. 再 次 考虑 上 面 P19 的 场景 。 给 出 分 组 交换 机 sl 和 s3 的 流 表 项 ,使 得 具有 h3 或 h4 源 地 址 的 任何 到 


达 数 据 报 被 路 由 到 在 下 数据 报 的 目的 地 址 字段 中 定义 的 目的 主机 。( 提示: 你 的 转发 表 规则 应 当 包 

括 如 下 情况 ， 即 到 达 的 数据 报 被 发 往 直 接连 接 的 主机 ,或 应 当 转 发 到 相 邻 路 由 器 以 便 传递 到 最 终 

主机 。) 

再 次 考虑 显示 在 图 4-30 中 的 SDN OpenFlow 网 络 。 假 定 我 们 希望 交换 机 s2 的 功能 像 防火 墙 一 样 。 在 

s2 中 定义 实现 下 列 防 火 墙 行为 的 流 表 ， 以 传递 目的 地 为 h3 和 h4 的 数据 报 (对 下 列 四 种 防火 墙 行 

为 ， 每 种 定义 一 张 不 同 的 流 表 ) 。 不 需要 在 s2 中 定义 将 流量 转发 到 其 他 路 由 器 的 转发 行为 。 

© 仅 有 从 主机 hl 和 h6 到 达 的 流量 应 当 传递 到 主机 3 BK h4 〈 即 从 主机 h2 和 hS 到 达 的 流量 被 阻 
Æ), 

© (LA TCP 流量 被 允许 传递 给 主机 h3 或 h4 (BI UDP 流量 被 阻塞 ) 。 

© MARTE h3 的 流量 被 传递 〈 即 所 有 到 h4 的 流量 被 阻塞) 。 

e (AKA hl 并 且 发 往 h3 的 UDP 流量 被 传递 。 所 有 其 他 流量 被 阻塞 。 


由 j Wireshark 实验 


在 与 本 书 配套 的 Web 站 点 www. pearsonhighered. com/cs-resources 上 ， 你 将 找到 一 个 Wireshark 实验 作 


业 ， 该 作业 考察 了 了 下 协议 的 运行 ,特别 是 外 数据 报 的 格式 。 
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MW 人 物 专访 


Vinton G. Cerf 是 Internet Evangelist for Google 公司 的 副 总 载 兼 主席 。 他 在 
MCI 公司 服务 了 16 年 ， 担任 过 各 种 职位 ， 最 后 以 技术 战略 部 资深 副 总 栽 的 
身份 结束 了 他 在 那里 的 任期 。 他 作为 TCP/IP 协议 和 因特网 体系 结构 的 共同 
设计 者 而 广为人知 。1976 年 到 1982 年 在 美国 国防 部 高 级 研究 计划 署 (DAR- 
PA) 任职 期 间 ， 他 在 领导 因特网 以 及 与 因特网 相关 的 数据 分 组 和 安全 技术 
的 研发 方面 发 挥 了 重要 作用 。 他 于 2005 年 获得 了 美国 总 统 自由 奖章 ， 于 
1977 年 获得 了 美国 国家 技术 奖章 。 他 在 斯 坦 福 大 学 获得 数学 学 士 学 位 ， 在 加 
利 福 尼 亚 大 学 洛杉矶 分 校 (UCLA) 获得 了 计算 机 科学 的 硕士 和 博士 学 位 。 








。 是 什么 使 您 专注 于 网 络 技术 的 呢 ? Vm Ge Ce 

20 世纪 60 年 代 未 ， 我 在 UCLA 一 直 做 程序 员 的 工作 。 我 的 工作 得 到 了 美国 国防 部 高 级 研究 计划 署 
( 那 时 叫 ARPA， 现 在 叫 DARPA) 的 支持 。 我 那 时 在 刚 创建 不 久 的 ARPAnet 的 网 络 测量 中 心 ， 为 Leonard 
Kleinrock 教授 的 实验 室 工作 。ARPAnet 的 第 一 个 节点 于 1969 年 9 月 1 日 安装 在 UCLA。 我 负责 为 计算 机 
编程 ， 以 获取 有 关 ARPAnet 的 性 能 信息 ， 并 报告 这 些 信息 以 便 与 数学 模型 作 比较 ， 预 测 网 络 性 能 。 

我 和 其 他 几 名 研究 生 负 责 研 制 所 谓 的 ARPAnet 主机 级 协议 ， 该 协议 的 过 程 和 格式 将 使 得 网 络 中 许多 
不 同类 型 的 计算 机 相互 交互 。 这 是 我 进入 分 布 式 计算 与 通信 新 世界 中 的 一 次 迷人 的 探索 。 

© 当 您 第 一 次 设计 该 协议 时 ， 您 曾 想象 过 IP 会 像 今天 这 样 变 得 无 所 不 在 吗 ? 

当 我 和 Bob Kahn 于 1973 年 最 初 从 事 该 项 工作 时 ， 我 想 我 们 的 注意 力 大 多 集中 在 这 样 一 个 重要 的 问 
题 上 : 假定 我 们 不 能 实际 改变 这 些 网 络 本 身 ， 那 么 怎样 才能 让 异 构 的 分 组 网 络 彼此 互 操 作 呢 ?我 们 希望 
能 找到 一 种 方法 可 以 使 任意 多 的 分 组 交换 网 以 透明 的 方式 进行 互联 ， 以 便 主机 彼此 之 间 不 做 任何 转换 就 
能 进行 端 到 端 通信 。 我 认为 我 们 那 时 已 经 知道 了 我 们 正在 处 理 强大 的 和 可 扩充 的 技术 ， 但 还 没 清楚 地 想 
过 有 数 亿 台 计 算 机 都 连 入 因特网 时 的 世界 会 是 什么 样 。 

。 您 现在 能 预见 网 络 与 因特网 的 未 来 吗 ?您 认为 在 它们 的 发 展 中 存在 的 最 大 挑战 或 障碍 是 什么 ? 

我 相信 因特网 本 身 以 及 一 般 的 网 络 都 将 要 继续 扩大 。 已 有 令 人 信服 的 证 据 表 明 ， 在 因特网 上 将 有 数 
十 亿 个 因特网 使 能 设备 ， 包 括 移动 电话 、 冰 箱 、 个 人 数字 助理 、 家 用 服务 器 、 电 视 等 家 用 电器 ， 以 及 大 
批 通常 的 便携 机 、 服 务 器 等 。 重 大 挑战 包括 支持 移动 性 、 电 池 寿 命 、 网 络 接 入 链 路 的 容量 、 以 不 受 限 的 
方式 扩展 网 络 光学 核心 的 能 力 。 设 计 因 特 网 的 星际 扩展 是 我 在 喷气 推进 实验 室 深入 研究 的 一 项 计划 。 我 
们 需要 从 IPv4 (32 比特 地 址 ) 过 渡 到 IPw6 (128 比特 ) 。 要 做 的 事情 实在 是 太 多 了 ! 

© 是 谁 激发 了 您 的 职业 灵感 ? 

我 的 同事 Bob Kahn 、 我 的 论文 导师 Gerald Estrin, 我 最 好 的 朋友 Steve Crocker (我 们 在 高 中 就 认识 
T, 1960 年 是 他 带 我 进入 了 计算 机 学 科 之 门 1) ， 以 及 数 千 名 今天 仍 在 继续 推动 因特网 发 展 的 工程 师 。 

。 您 对 进入 网 络 / 因 特 网 领域 的 学 生 有 什么 忠告 吗 ? 

要 跳出 现 有 系统 的 限制 来 思考 问题 ， 想 一 想 什 么 是 可 行 的 ; 随后 再 做 艰苦 工作 以 谋划 如 何 从 事物 的 
当前 状态 到 达 所 想 的 状态 。 要 敢于 想象 : 我 和 喷气 推进 实验 室 的 6 个 同事 一 直 在 从 事 陆地 因特网 的 星际 
扩展 设计 。 这 也 许 要 花 几 十 年 才能 实现 ， 任 务 会 一 个 接着 一 个 地 出 现 ， 可 以 用 这 句 话 来 总 结 : “一 个 人 
总 是 要 不 断 地 超越 自我 ， 否 则 还 有 什么 乐趣 可 言 ?” 
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网 络 层 : ”控制 平面 





在 本 章 中 ， 我们 将 通过 包含 网 络 层 的 控制 平面 组 件 来 完成 我 们 的 网 络 层 之 旅 。 控 制 平 
面 作为 一 种 网 络 范围 的 逻辑 ， 不 仅 控制 沿 着 从 源 主 机 到 目的 主机 的 端 到 端 路 径 间 的 路 由 器 
如 何 转发 数据 报 ， 而 且 控制 网 络 层 组 件 和 服务 如 何 配置 和 管理 。 在 5. 2 节 中 ， 我 们 将 包含 
传统 的 计算 图 中 最 低 开销 路 径 的 路 由 选择 算法 。 这 些 算 法 是 两 个 广 为 部 署 的 因特网 路 由 选 
择 协议 OSPF 和 BGP 的 基础 ， 我 们 将 分 别 在 5.3 节 和 5.4 节 中 涉及 。 如 我 们 将 看 到 的 那 
E, OSPF 是 一 种 运行 在 单一 ISP 的 网 络 中 的 路 由 选择 算法 。BGP 是 一 种 在 因特网 中 用 于 
互联 所 有 网 络 的 路 由 选择 算法 ， 因 此 常 被 称 为 因特网 的 “黏合 剂 ”。 传 统 上 ， 控 制 平面 功 
能 与 数据 平面 的 转发 功能 在 一 起 实现 ， 在 路 由 器 中 作为 统一 的 整体 。 如 我 们 在 第 4 章 所 学 
习 的 那样 ， 软 件 定义 网 络 (SDN) 在 数据 平面 和 控制 平面 之 间 做 了 明确 分 割 ， 在 一 台 分 离 
的 “控制 器 ”服务 中 实现 了 控制 平面 功能 ， 该 控制 器 服务 与 它 所 控制 的 路 由 器 的 转发 组 件 
完全 分 开 并 远离 。 我 们 将 在 5. 5 节 中 讨论 SDN 控制 器 。 

在 5.6 节 和 5.7 节 中 ,我 们 将 涉及 管理 耻 网 络 的 某 些 具体 细节 : ICMP (互联 网 控制 
报 文 协 议 ) 和 SNMP (简单 网 络 管理 协议 ) 。 


5.1 概述 


我 们 通过 回顾 图 4-2 和 图 4-3 ， 迅 速 建立 起 学 习 网 络 控制 平面 的 环境 。 在 这 里 ， 我 们 
看 到 了 转发 表 (在 基于 目的 地 转发 的 场景 中 ) 和 流 表 (在 通用 转发 的 场景 中 ) 是 链接 网 
络 层 的 数据 平面 和 控制 平面 的 首要 元 素 。 我 们 知道 这 些 表 定 义 了 一 台 路 由 器 的 本 地 数据 平 
面 转发 行为 。 我 们 看 到 在 通用 转发 的 场景 下 ， 所 采取 的 动作 (4.4.2 节 ) 不 仅 包括 转发 一 
个 分 组 到 达 路 由 器 的 每 个 输出 端口 ， 而 且 能 够 丢弃 一 个 分 组 、 复 制 一 个 分 组 和 /或 重 写 第 
2、3 或 4 层 分 组 首部 字段 。 
在 本 章 中 ， 我 们 将 学 习 这 些 转发 表 和 流 表 是 如 何 计算 、 维 护 和 安装 的 。 在 4.1 节 的 网 
络 层 概述 中 ， 我 们 已 经 学 习 了 完成 这 些 工 作 有 两 种 可 能 的 方法 。 
每 路 由 器 控制 。 图 5-1 显示 了 在 每 台 路 由 器 中 运行 一 种 路 由 选择 算法 的 情况 ， 每 台 
路 由 器 中 都 包含 转发 和 路 由 选择 功能 。 每 台 路 由 器 有 一 个 路 由 选择 组 件 ， 用 于 与 其 
他 路 由 器 中 的 路 由 选择 组 件 通信 ， 以 计算 其 转发 表 的 值 。 这 种 每 路 由 器 控制 的 方法 
在 因特网 中 已 经 使 用 了 几 十 年 。 将 在 5.3 节 和 5. 4 节 中 学 习 的 OSPF 和 BGP 协议 都 
是 基于 这 种 每 路 由 器 的 方法 进行 控制 的 。 
。 逻辑 集中 式 控制 。 图 5-2 显示 了 逮 辑 集中 式 控制 器 计算 并 分 发 转发 表 以 供 每 台 路 由 
器 使 用 的 情况 。 如 我 们 在 4. 4 节 中 所 见 ， 通 用 的 “匹配 加 动作 ”抽象 允许 执行 传统 
的 IP 转 发 以 及 其 他 功能 (负载 共享 、 防 火 墙 功 能 和 NAT) 的 丰富 集合 ， 而 这 些 功 
能 先前 是 在 单独 的 中 间 盒 中 实现 的 。 
该 控制 器 经 一 种 定义 良好 的 协议 与 每 台 路 由 器 中 的 一 个 控制 代理 (CA) 进行 交互 ， 
以 配置 和 管理 该 路 由 器 的 转发 表 。CA 一 般 具 有 最 少 的 功能 ， 其 任务 是 与 控制 器 通信 并 且 
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按 控制 器 命令 行事 。 与 图 5-1 中 的 路 由 选择 算法 不 同 ， 这 些 CA 既 不 能 直接 相互 交互 ， 也 
不 能 主动 参与 计算 转发 表 。 这 是 每 路 由 器 控制 和 逻辑 集中 式 控制 之 间 的 关键 差异 。 


a 


图 5-1 每 路 由 器 控制 : 在 控制 平面 中 各 个 路 由 选择 算法 组 件 相互 作用 





图 5-2 逻辑 集中 式 控制 : 一 个 完全 分 开 的 〈 通 常 是 远 地 的 ) 控制 器 与 本 地 控制 代理 交互 


“逻辑 集中 式 ” 控 制 [Levin 2012] 意味 着 就 像 路 由 选择 控制 服务 位 于 单一 的 集中 服务 点 
那样 获取 它们 ， 即 使 该 服务 出 于 容错 和 性 能 扩展 性 的 原因 ， 很 可 能 经 由 多 个 服务 器 实现 。 正 
如 我 们 将 在 5. 5 节 中 所 见 ，SDN 采用 了 钦 辑 集中 式 控制 器 的 概念 ， 而 这 种 方法 在 生产 部 署 中 
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得 到 了 越 来 越 多 的 应 用 。 谷 歌 在 它 的 内 部 B4 全 球 广域网 中 使 用 了 SDN 控制 路 由 器 ， 该 广 域 
网 互联 了 它 的 数据 中 心 [Jain 2013] 。 来 自 微软 研究 院 的 SWAN [Hong 2013], ， 使 用 了 一 个 逻 
辑 集中 式 控 制 器 来 管理 广域网 和 数据 中 心 网 络 之 间 的 路 由 选择 和 转发 。 中 国电 信和 中 国联 通 
在 它们 的 数据 中 心 内 以 及 数据 中 心 之 间 使 用 SDN [Li 2015], AT&T 已 经 通告 [AT&T 2013 ] : 
“支持 许多 SDN 能 力 ， 支 持 SDN 体系 结构 框架 下 独立 定义 的 、 专 用 的 机 制 。 


5.2 路 由 选择 算法 


在 本 节 中 ， 我 们 将 学 习 路 由 选择 算法 (routing algorithm) ， 其 目的 是 从 发 送 方 到 接收 
方 的 过 程 中 确定 一 条 通过 路 由 器 网 络 的 好 的 路 径 ( 等 价 于 路 由 ) 。 通 常 ， 一 条 好 路 径 指 具 
有 最 低 开销 的 路 径 。 然 而 我 们 将 看 到 ， 实 践 中 现实 世界 还 关心 诸如 策略 之 类 的 问题 ( 例 
如 ， 有 一 个 规则 是 “属于 组 织 Y 的 路 由 器 X 不 应 转发 任何 来 源 于 组 织 Z 所 属 网 络 的 分 
组 ”)。 我 们 注意 到 无 论 网 络 控制 平面 采用 每 路 由 器 控制 方法 ， 还 是 采用 逻辑 集中 式 控 制 方 
法 ， 必 定 总 是 存在 一 条 定义 良好 的 一 连 串 路 由 器 ， 使 得 分 组 从 发 送 主 机 到 接收 主机 跨越 网 
络 “ 旅 行 "。 因 此 ， 计算 这 些 路 径 的 路 由 选择 算法 是 十 分 重要 的 ， 是 最 重要 的 10 个 十 分 重 
要 的 网 络 概 念 之 一 。 

可 以 用 图 来 形式 化 描述 路 由 选择 问题 。 我 们 知道 图 (graph) G=(N, E) 是 一 个 NN 个 
节点 和 一 条 边 的 集合 ， 其 中 每 条 边 是 取 自 N 的 一 对 节点 。 在 网 络 层 路 由 选择 的 环境 中 ， 图 
中 的 节点 表示 路 由 器 ， 这 是 做 出 分 组 转发 决定 的 点 ; 连接 这 些 节 点 的 边 表 示 这 些 路 由 器 之 
间 的 物理 链 路 。 这 样 一 个 计算 机 网 络 的 图 抽象 显 
示 在 图 5-3 中 。 若 要 查看 某 些 表示 实际 网 络 的 图 ， 
参见 [Dodge 2016; Cheswick 2000]; 对 于 基于 不 
同 的 图 模型 建 模 因 特 网 的 好 坏 的 讨论 ， 参 见 [Ze- 
gura 1997; Faloutsos 1999; Li 2004] 。 

如 图 5-3 所 示 ， 一 条 边 还 有 一 个 值 表 示 它 的 开 
销 。 通 常 ， 一 条 边 的 开销 可 反映 出 对 应 链 路 的 物 
理 长 度 〈 例 如 一 条 越 洋 链 路 的 开销 可 能 比 一 条 短 
途 陆 地 链 路 的 开销 高 ) ， 它 的 链 路 速度 ， 或 与 该 链 
路 相关 的 金钱 上 的 开销 。 为 了 我 们 的 目的 ， 我 们 
只 将 这 些 链 路 开销 看 成 是 给 定 的 ， 而 不 必 操 心 这 些 值 是 如 何 确定 的 。 对 于 E 中 的 任 一 条 边 
(x, y), RMM clx, y) 表示 节点 x My 间 边 的 开销 。 如 果 节 点 对 (x; y) 不 属于 E， 则 
置 c(x, y) = wm。 此 外 ， 我 们 在 这 里 考虑 的 都 是 无 向 图 ( 即 图 的 边 没 有 方向 )， 因 此 边 
(x, y) 与 边 (y, x) 是 相同 的 并 且 c(x,y) =c(y，x) 。 然 而 ， 我 们 将 学 习 的 算法 能 够 很 
容易 地 扩展 到 在 每 个 方向 有 不 同 开销 的 有 向 链 路 场合 。 同 时 ， 如 果 (x, y) BFE, WA 
y 也 被 称 为 节点 x 的 邻居 (neighbor) 。 

在 图 抽象 中 为 各 条 边 指派 了 开销 后 ， 路 由 选择 算法 的 天 然 目 标 是 找 出 从 源 到 目的 地 间 
的 最 低 开销 路 径 。 为 了 使 问题 更 为 精确 ， 回 想 在 图 C=(N, E) 中 的 一 条 路 径 (path) 是 
NRR (as 二 全， 夯 】)， 这 样 每 一 个 对 (a, %)s rs thares (4%), %) Æ 
E 中 的 边 。 路 径 (x!，zx;,…，x,) 的 开销 只 是 沿 着 路 径 所 有 边 的 开销 的 总 和 ， 即 
c(x,, x) telt, x3) Ci 和 5 给 定 任何 两 个 节点 x Ally, 通常 在 这 两 个 节点 之 
间 有 许多 条 路 径 ， 每 条 路 径 都 有 一 个 开销 。 这 些 路 径 中 的 一 条 或 多 条 是 最 低 开销 路 径 





图 5-3 一 个 计算 机 网 络 的 抽象 图 模型 
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(least-cost path) 。 因 此 最 低 开销 路 径 问 题 是 清楚 的 : 找 出 源 和 目的 地 之 间 具 有 最 低 开 销 的 
一 条 路 。 例 如 ， 在 图 5-3 中 ， 源 节点 u 和 目的 节点 w 之 间 的 最 低 开 销路 径 是 (u, x, y, 
w) ， 具 有 的 路 径 开销 是 3。 注 意 到 车 在 图 中 的 所 有 边 具有 相同 的 开销 ， 则 最 低 开销 路 径 也 
就 是 最 短路 径 (shortest path) ， 即 在 源 和 目的 地 之 间 的 具有 最 少 链 路 数量 的 路 径 。 

作为 一 个 简单 练习 ， 试 找 出 图 5-3 中 从 节点 到 节点 z 的 最 低 开销 路 径 ， 并 要 反映 出 
你 是 如 何 算出 该 路 径 的 。 如 果 你 像 大 多 数 人 一 样 ， 通 过 考察 图 5-3， 跟 踪 几 条 从 到 z 的 
路 由 ， 你 就 能 找 出 从 到 z 的 路 径 ， 然 后 以 某 种 方式 来 确信 你 所 选择 的 路 径 就 是 所 有 可 能 
的 路 径 中 具有 最 低 开 销 的 路 径 。( 你 考察 过 w 到 z 之 间 的 所 有 17 条 可 能 的 路 径 吗 ? 很 可 能 
没有 !) 这 种 计算 就 是 一 种 集中 式 路 由 选择 算法 的 例子 ， 即 路 由 选择 算法 在 一 个 位 置 (你 
的 大 脑 中 ) 运行 ， 该 位 置 具 有 网 络 的 完整 信息 。 一 般 而 言 ， 路 由 选择 算法 的 一 种 分 类 方式 
是 根据 该 算法 是 集中 式 还 是 分 散 式 来 划分 。 

。 集中 式 路 由 选择 算法 (centralized routing algorithm) 用 完整 的 、 全 局 性 的 网 络 知 识 

计算 出 从 源 到 目的 地 之 间 的 最 低 开 销路 径 。 也 就 是 说 ， 该 算法 以 所 有 节点 之 间 的 
连通 性 及 所 有 链 路 的 开销 为 输入 。 这 就 要 求 该 算法 在 真正 开始 计算 以 前 ， 要 以 某 
种 方式 获得 这 些 信息 。 计 算 本 身 可 在 某 个 场 点 (例如 ,图 5-2 中 所 示 的 逻辑 集中 
式 控 制 器 ) VET, 或 在 每 台 路 由 器 的 路 由 选择 组 件 中 重复 进行 (例如 在 图 5-1 
中 ) 。 然 而 ， 这 里 的 主要 区 别 在 于 ， 集 中 式 算 法 具有 关于 连通 性 和 链 路 开销 方面 的 
完整 信息 。 具 有 全 局 状态 信息 的 算法 常 被 称 作 链 路 状态 〈Link State, LS) Bik, 
因为 该 算法 必须 知道 网 络 中 每 条 链 路 的 开销 。 我 们 将 在 5. 2. 1 节 中 学 习 LS 算法 。 

e 在 分 散 式 路 由 选择 算法 (decentralized routing algorithm) F, KAALE., 246 

式 的 方式 计算 出 最 低 开 销路 径 。 没 有 节点 拥有 关于 所 有 网 络 链 路 开销 的 完整 信息 。 
相反 ， 每 个 节点 仅 有 与 其 直接 相连 链 路 的 开销 知识 即 可 开始 工作 。 然 后 ， 通 过 迭 
代 计 算 过 程 以 及 与 相 邻 节点 的 信息 交换 ， 一 个 节点 逐渐 计算 出 到 达 某 目的 节点 或 
一 组 目的 节点 的 最 低 开 销路 径 。 我 们 将 在 后 面 的 5.2. 2 节 学 习 一 个 称 为 距离 向 量 
(Distance- Vector, DV) 算法 的 分 散 式 路 由 选择 算法 。 之 所 以 叫 作 DV 算法 ， 是 因 
为 每 个 节点 维护 到 网 络 中 所 有 其 他 节点 的 开销 (距离 ) 估计 的 向 量 。 这 种 分 散 式 
算法 ， 通 过 相 邻 路 由 器 之 间 的 交互 式 报 文 交 换 ， 也 许 更 为 天 然 地 适合 那些 路 由 器 
直接 交互 的 控制 平面 ， 就 像 在 图 5-1 中 那样 。 

路 由 选择 算法 的 第 二 种 广义 分 类 方式 是 根据 算法 是 静态 的 还 是 动态 的 进行 分 类 。 在 静 
态 路 由 选择 算法 (static routing algorithm) 中 ， 路 由 随时 间 的 变化 非常 缓慢 ， 通 常 是 人 工 进 
行 调整 (如 人 为 手工 编辑 一 条 链 路 开销 )。 动 态 路 由 选择 算法 (dynamic routing algorithm ) 
随 着 网 络 流量 负载 或 拓扑 发 生变 化 而 改变 路 由 选择 路 径 。 一 个 动态 算法 可 周期 性 地 运行 或 
直接 响应 拓扑 或 链 路 开销 的 变化 而 运行 。 虽 然 动 态 算法 易于 对 网 络 的 变化 做 出 反应 ， 但 也 
更 容易 受 诸如 路 由 选择 循环 、 路 由 振荡 之 类 问题 的 影响 。 

路 由 选择 算法 的 第 三 种 分 类 方式 是 根据 它 是 负载 敏感 的 还 是 负载 迟钝 的 进行 划分 。 在 
负载 敏感 算法 (load-sensitive algorithm) 中 ， 链 路 开销 会 动态 地 变化 以 反映 出 底层 链 路 的 
当前 拥塞 水 平 。 如 果 当 前 拥塞 的 一 条 链 路 与 高 开销 相 联系 ， 则 路 由 选择 算法 趋向 于 绕 开 该 
拥塞 链 路 来 选择 路 由 。 而 早期 的 ARPAnet 路 由 选择 算法 就 是 负载 敏感 的 【McQuillan 
1980] ， 所 以 遇 到 了 许多 难题 [Huitema 1998 ] 。 当 今 的 因特网 路 由 选择 算法 (如 RIP, 
OSPFAI BGP) 都 是 负载 迟钝 的 (1load-insensitive) ， 因 为 某 条 链 路 的 开销 不 明确 地 反映 其 当 
前 (或 最 近 ) 的 拥塞 水 平 。 


246 5# 


5.2.1 链 路 状态 路 由 选择 算法 


前 面 讲 过 ， 在 链 路 状态 算法 中 ， 网 络 拓扑 和 所 有 的 链 路 开销 都 是 已 知 的 ， 也 就 是 说 可 
FAVE LS 算法 的 输入 。 实 践 中 这 是 通过 让 每 个 节点 向 网 络 中 所 有 其 他 节点 广播 链 路 状态 分 
组 来 完成 的 ， 其 中 每 个 链 路 状态 分 组 包含 它 所 连接 的 链 路 的 标识 和 开销 。 在 实践 中 (例如 
使 用 因特网 的 OSPF 路 由 选择 协议 ,讨论 见 5.3 节 ) ， 这 经 常 由 链 路 状态 广播 (link state 
broadcast) 算法 [Perlman 1999] 来 完成 。 节 点 广播 的 结果 是 所 有 节点 都 具有 该 网 络 的 统 
一 、 完 整 的 视图 。 于 是 每 个 节点 都 能 够 像 其 他 节点 一 样 ， 运 行 LS 算法 并 计算 出 相同 的 最 
低 开 销路 径 集 合 。 

我 们 下 面 给 出 的 链 路 状态 路 由 选择 算法 叫 作 Dijkstra 算法 ， 该 算法 以 其 发 明 者 命名 。 一 
个 密切 相关 的 算法 是 Prim 算法 ， 有 关 图 算法 的 一 般 性 讨论 参见 [Comen 2001 ] Dijkstra 算 
法 计算 从 某 节点 ( 源 节点 ,我 们 称 之 为 u) 到 网 络 中 所 有 其 他 节点 的 最 低 开 销路 径 。Dijkstra 
算法 是 迭代 算法 ， 其 性 质 是 经 算法 的 第 上 次 迭代 后 ， 可 知道 到 天 个 目的 节点 的 最 低 开 销路 径 ， 
在 到 所 有 目的 节点 的 最 低 开销 路 径 之 中 ,这 条 路 径 具 有 % 个 最 低 开销 。 我 们 定义 下 列 记号 。 

© Div): 到 算法 的 本 次 迭代 ， 从 源 节点 到 目的 节点 v 的 最 低 开销 路 径 的 开销 。 

© plv): 从 源 到 vw 沿 着 当前 最 低 开销 路 径 的 前 一 节点 (v 的 邻居 ) o 

oN: 节点 子 集 ; 如 果 从 源 到 v 的 最 低 开销 路 径 已 确 知 ,v 在 入 ' 中 。 

该 集中 式 路 由 选择 算法 由 一 个 初始 化 步 又 和 其 后 的 循环 组 成 。 循 环 执行 的 次 数 与 网 络 中 
节点 个 数 相同 。 一 旦 终止 ,该 算法 就 计算 出 了 从 源 节点 w 到 网 络 中 每 个 其 他 节点 的 最 短路 径 。 

源 节 点 U 的 链 路 状态 (LS) 算法 


Initialization: 
N’ = {u} 
for all nodes v 
if v is a neighbor of u 
then D(v) = c(u,v) 
else D(v) = œ 


OO PP 


Loop 

9 find w not in N’ such that D(w) is a minimum 

10 add w to N’ 

11 update D(v) for each neighbor v of w and not in N’: 


12 D(v) = min(D(v), D(w)+ c(w,v) ) 
t3 /* new cost to v is either old cost to v or known 
14 least path cost to w plus cost from w to v */ 


15 until N’= N 


举 一 个 例子 ， 考 虑 图 5-3 中 的 网 络 ， 计 算 从 w 到 所 有 可 能 目的 地 的 最 低 开销 路 径 。 该 
算法 的 计算 过 程 以 表格 方式 总 结 于 表 5-1 中 ， 表 中 的 每 一 行 给 出 了 迭代 结束 时 该 算法 的 变 
量 的 值 。 我 们 详细 地 考虑 前 几 个 步骤 。 


表 5-1 在 图 5-3 中 的 网 络 上 运行 的 链 路 状态 算法 


步骤 N' Div), piv) Diw), p(w) D(x), p(x) DIY), ply) D(z), p(z) 
0 u F +, u l,u æ œ 
1 ux 2, u 4, x 2, œ 
2 uxy Dy tt 3,7 4; ¥ 
3 uxyv 3, y 4, Y 
4 uxyvw 4, y 
5 uxyvwz 
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。 在 初始 化 步骤 ， 从 到 与 其 直接 相连 的 邻居 v、x、w 的 当前 已 知 最 低 开销 路 径 分 别 
初始 化 为 2、1 和 5。 特 别 值得 注意 的 是 ， 到 w 的 开销 被 设 为 5 (尽管 我 们 很 快 就 会 
看 见 确实 存在 一 条 开销 更 小 的 路 径 ) ， 因 为 这 是 从 之 到 vw 的 直接 (一 跳 ) 链 路 开 
销 。 到 y 与 z 的 开销 被 设 为 无 穷 大 ， 因 为 它们 不 直接 与 连接 。 

在 第 一 次 迭代 中 ,我们 观察 那些 还 未 加 到 集合 N' 中 的 节点 ， 并且 找 出 在 前 一 次 迭 
代 结 束 时 具有 最 低 开 销 的 节点 。 那 个 节点 便 是 x*， 其 开销 是 1， 因 此 x 被 加 到 集合 
N'A, FE LS 算法 中 的 第 12 行 中 的 程序 被 执行 ， 以 更 新 所 有 节点 v 的 D(v)， 产 
生 表 5-1 中 第 2 行 (ER) 所 示 的 结果 。 到 wv 的 路 径 开销 未 变 。 经 过 节点 x 到 w 
(在 初始 化 结束 时 其 开销 为 5) 的 路 径 开销 被 发 现 为 4。 因 此 这 条 具有 更 低 开 销 的 路 
径 被 选中 ， 且 沿 从 开始 的 最 短路 径 上 w' 的 前 一 节点 被 设 为 x。 类 似 地 ,到 y (经 
过 x) 的 开销 被 计算 为 2， 且 该 表 也 被 相应 地 更 新 。 

在 第 二 次 迭代 时 ， 节 点 "与 了 被 发 现 具有 最 低 开 销路 径 (2) ， 并 且 我 们 任意 改变 次 
FH y MEREN P, EEN PRA u, 和 7。 到 仍 不 在 N' 中 的 其 余 节 点 ( 即 节 
点 v、w 和 z) 的 开销 通过 LS 算法 中 的 第 12 行进 行 更 新 ， 产生 如 表 5-1 中 第 3 行 所 
示 的 结果 。 

© 如 此 等 等 。 

当 LS 算法 终止 时 ， 对 于 每 个 节点 ， 我 们 都 得 到 从 源 节点 沿 着 它 的 最 低 开 销路 径 的 
前 一 节点 。 对 于 每 个 前 一 节点 ， 我 们 又 有 它 的 前 一 节点 ， 以 此 方式 我 们 可 以 构建 从 源 节 
点 到 所 有 目的 节点 的 完整 路 径 。 通 过 对 每 个 目的 节点 存放 从 w 到 目的 地 的 最 低 开 销路 径 
上 的 下 一 跳 节点 ， 在 一 个 节点 (如 节 
Bw) 中 的 转发 表 则 能 够 根据 此 信息 
而 构建 。 图 5-4 显示 了 对 于 图 5-3 中 
的 网 络 产 生 的 最 低 开 销路 径 和 中 的 
转发 表 。 

该 算法 的 计算 复杂 性 是 什么 ?” 即 给 
En NEA 〈 不 算 源 节 点 ) ， 在 最 坏 情 
况 下 要 经 过 多 少 次 计算 ， 才 能 找到 从 源 节 点 到 所 有 目的 节点 的 最 低 开 销路 径 ? 在 第 一 次 迭 
代 中 ,我 们 需要 搜索 所 有 的 于 个 节点 以 确定 出 不 在 W' 中 上 且 具有 最 低 开 销 的 节点 w。 在 第 二 
次 迭代 时 ,我们 需要 检查 n -1 个 节点 以 确定 最 低 开销 。 第 三 次 对 n -2 个 节点 迭代 ， 依 次 
类 推 。 总 之 ,我 们 在 所 有 过 代 中 需要 搜寻 的 节点 总 数 为 n(n+1)/2， 因 此 我 们 说 前 面 实 现 
的 链 路 状态 算法 在 最 差 情况 下 复杂 性 为 0(n )。( 该 算法 的 一 种 更 复杂 的 实现 是 使 用 一 种 
称 为 堆 的 数据 结构 ， 能 用 对 数 时 间 而 不 是 线性 时 间 得 到 第 9 行 的 最 小 值 ， 因 而 减少 其 复 
杂 性 。) 

在 完成 LS 算法 的 讨论 之 前 ， 我 们 考虑 一 下 可 能 出 现 的 问题 。 图 5-5 显示 了 一 个 简单 
的 网 络 拓扑 ， 图 中 的 链 路 开销 等 于 链 路 上 承载 的 负载 ， 例 如 反映 要 历经 的 时 延 。 在 该 例 
中 ， 链 路 开销 是 非 对 称 的 ， 即 仅 当 在 链 路 (Cu, v) 两 个 方向 所 承载 的 负载 相同 时 c(u,，v) 
与 c(v, u) 才 相 等 。 在 该 例 中 ， 节 点 z 产生 发 往 w 的 一 个 单元 的 流量 ， 节 点 % 也 产生 发 往 
w 的 一 个 单元 的 流量 ， 并 上 且 节 点 y 也 产生 发 往 w 的 一 个 数量 为 e 的 流量 。 初 始 路 由 选择 情 
况 如 图 5-5a 所 示 ， 其 链 路 开销 对 应 于 承载 的 流量 。 

当 LS 算法 再 次 运行 时 ， 节 点 y 确定 (基于 图 5-5a 所 示 的 链 路 开销 ) 顺 时 针 到 w 的 路 
径 开 销 为 1， 而 逆 时 针 到 w 的 路 径 开销 (一直 使 用 的 ) 是 1+e。 因 此 y 到 w 的 最 低 开销 路 





图 5-4 对 于 节点 的 最 低 开销 路 径 和 转发 表 
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径 现 在 是 顺 时 针 的 。 类 似 地 ，x 确定 其 到 w 的 新 的 最 低 开 销路 径 也 是 顺 时 针 的 ， 产 生 如 
图 5-5b 中 所 示 的 开销 。 当 LS 算法 下 次 运行 时 ， 节 点 x*、y 和 = 都 检测 到 一 条 至 w 的 逆 时 针 
方向 零 开销 路 径 ， 它 们 都 将 其 流量 引导 到 逆 时 针 方 向 的 路 由 上 。 下 次 LS 算法 运行 时 ，x、 
y 和 z 都 将 其 流量 引导 到 顺 时 针 方 向 的 路 由 上 。 










iol ~ 


a) 初始 路 由 选择 b) x、y 检 测 到 w 的 更 好 路 径 ， 顺 时 针 


c) x ys 2 检测 到 w 的 更 好 路 径 ， 逆 时 针 d) xy ys z 检 测 到 w 的 更 好 路 径 ， 顺 时 针 
图 5-5 拥塞 敏感 的 路 由 选择 的 振荡 


如 何 才能 防止 这 样 的 振 功 〈 它 不 只 是 出 现在 链 路 状态 算法 中 ， 而 且 也 可 能 出 现在 任 
何 使 用 拥塞 或 基于 时 延 的 链 路 测度 的 算法 中 ) 。 一 种 解决 方案 可 能 强制 链 路 开销 不 依赖 
于 所 承载 的 流量 ， 但 那 是 一 种 不 可 接受 的 解决 方案 ， 因 为 路 由 选择 的 目标 之 一 就 是 要 避 
开 高 度 拥 塞 (如 高 时 延 ) 的 链 路 。 另 一 种 解决 方案 就 是 确保 并 非 所 有 的 路 由 器 都 同时 
运行 LS 算法 。 这 似乎 是 一 个 更 合理 的 方案 ， 因 为 我 们 希望 即使 路 由 器 以 相同 周期 运行 
LS 算法 ， 在 每 个 节点 上 算法 执行 的 时 机 也 将 是 不 同 的 。 有 趣 的 是 ， 研 究 人 员 近 来 已 注 
意 到 了 因特网 上 的 路 由 器 能 在 它们 之 间 进 行 自 同 步 [Floyd Synchronization 1994 ] 。 这 就 
是 说 ， 即 使 它们 初始 时 以 同一 周期 但 在 不 同时 刻 执行 算法 ， 算 法 执行 时 机 最 终 会 在 路 由 
器 上 变 为 同步 并 保持 之 。 避 免 这 种 自 同步 的 一 种 方法 是 ， 让 每 台 路 由 器 发 送 链 路 通告 的 
时 间 随 机 化 。 

学 习 过 LS 算法 之 后 ， 我 们 接 下 来 考虑 目前 在 实践 中 使 用 的 其 他 重要 的 路 由 选择 算法 ， 
即 距离 向 量 路 由 选择 算法 。 


5.2.2 距离 向 量 路 由 选择 算法 


距离 向 量 (Distance-Vector, DV) 算法 是 一 种 迭代 的 、 异 步 的 和 分 布 式 的 算法 ,而 LS 
算法 是 一 种 使 用 全 局 信息 的 算法 。 说 它 是 分 布 式 的， 是 因为 每 个 节点 都 要 从 一 个 或 多 个 直 
接 相 连 邻居 接收 某 些 信息 ， 执 行 计算 ,然后 将 其 计算 结果 分 发 给 邻居 。 说 它 是 迭代 的 ， 是 
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因为 此 过 程 一 直 要 持续 到 邻居 之 间 无 更 多 信息 要 交换 为 止 。( 有趣 的 是 ， 此 算法 是 自我 终 
止 的 ， 即 没 有 计算 应 该 停止 的 信号 ， 它 就 停止 了 。) 说 它 是 异步 的 ， 是 因为 它 不 要 求 所 有 
节点 相互 之 间 步 伐 一 致 地 操作 。 我 们 将 看 到 一 个 异步 的 、 迭 代 的 、 自 我 终止 的 、 分 布 式 的 
算法 比 一 个 集中 式 的 算法 要 有 趣 得 多 ! 

在 我 们 给 出 DV 算法 之 前 ， 有 必要 讨论 一 下 存在 于 最 低 开 销路 径 的 开销 之 间 的 一 种 重 
要 关系 。 令 d,(y) 是 从 节点 x 到 节点 y 的 最 低 开 销路 径 的 开销 。 则 该 最 低 开销 与 著名 的 
Bellman- Ford 方程 相关 ， 即 

d,(y) = min,|c(x,v) + d,(y) | (5-1) 

方程 中 的 min, 是 对 于 x 的 所 有 邻居 的 。Bellman- Ford 方程 是 相当 直观 的 。 实 际 上 ,从 x 
到 v 遍历 之 后 ， 如 果 我 们 接 下 来 取 从 v 到 y 的 最 低 开 销路 径 ， 则 该 路 径 开销 将 是 c(x, v) + 
d,(y) 。 因 此 我 们 必须 通过 遍历 某 些 邻居 wv 开始， 从 x 到 y 的 最 低 开 销 是 对 所 有 邻居 vw 的 
c(x, v) +d,(y) 的 最 小 值 。 

但 是 对 于 那些 可 能 怀疑 该 方程 正确 性 的 人 ， 我 们 核查 在 图 5-3 中 的 源 节点 wu 和 目的 节 
点 z。 源 节点 有 3 个 邻居 : 节点 v、x 和 w。 通 过 遍历 该 图 中 的 各 条 路 径 ， 容 易 看 出 d,(z) = 
5、d.(z) =3 和 4d,(z) =3。 将 这 些 值 连同 开销 c(u, v) =2, c(u, x)=1 Melu, w) =5 代 
入 方程 (5-1)， 得 出 d,(z) =min|2 +5, 5+3,1+3| =4， 这 显然 是 正确 的 ， 并 且 对 同一 
个 网 络 来 说 ， 这 正 是 Dijkstra 算法 为 我 们 提供 的 结果 。 这 种 快速 验证 应 当 有 助 于 消除 你 可 
能 具有 的 任何 怀疑 。 

Bellman- Ford 方程 不 止 是 一 种 智力 上 的 珍品 ， 它 实际 上 具有 重大 的 实践 重要 性 。 特 别 
是 对 Bellman- Ford 方程 的 解 为 节点 x 的 转发 表 提供 了 表 项 。 为 了 理解 这 一 点 ， 令 罗 是 取得 
方程 (5-1) 中 最 小 值 的 任何 相 邻 节点 。 接 下 来 ， 如 果 节 点 x 要 沿 着 最 低 开 销路 径 向 节点 7 
发 送 一 个 分 组 ， 它 应 当 首先 向 节点 转发 该 分 组 。 因 此 ， 节 点 x 的 转发 表 将 指定 节点 v” 
作为 最 终 目的 地 7y 的 下 一 跳 路 由 器 。Bellman- Ford 方程 的 另 一 一 个 重要 实际 贡献 是 ， 它 提出 
了 将 在 DV 算法 中 发 生 的 邻居 到 邻居 通信 的 形式 。 

其 基本 思想 如 下 。 每 个 节点 x 以 D.(y) Fik, IEN 中 的 所 有 节点 y， 估 计 从 x* 到 y 
的 最 低 开 销路 径 的 开销 。 令 了 D.=[D.(y): yeN] 是 节点 x 的 距离 向 量 ,该 向 量 是 从 x 到 
在 NN 中 的 所 有 其 他 节点 y 的 开销 估计 向 量 。 使 用 DV 算法 ， 每 个 节点 x 维护 下 列 路 由 选择 
信息 : 

© 对 于 每 个 邻居 v， 从 * 到 直接 相连 邻居 v 的 开销 为 c(x，v)。 

e 节点 x 的 距离 向 量 , 即 D, =[D;(y): yeN], 包含 了 * 到 NN 中 所 有 目的 地 y 的 开销 

估计 值 。 

e 它 的 每 个 邻居 的 距离 向 量 ， 即 对 x 的 每 个 邻居 v,， A D, =[D,(y): yeN]。 

在 该 分 布 式 、 异 步 算法 中 ， 每 个 节点 不 时 地 向 它 的 每 个 邻居 发 送 它 的 距离 向 量 副本 。 
当 节 点 x 从 它 的 任何 一 个 邻居 vw 接收 到 一 个 新 距离 向 量 ， 它 保存 v" 的 距离 向 量 ， 然 后 使 用 
Bellman- Ford 方程 更 新 它 自己 的 距离 向 量 如 下 : 

D,(y) = min,{c(x,v) +D,(y)| 对 入 中 的 每 个 节点 

如 果 节 点 x 的 距离 向 量 因 这 个 更 新 步骤 而 改变 ,节点 x 接 下 来 将 向 pe 
其 更 新 后 的 距离 向 量 ， 这 继而 让 所 有 邻居 更 新 它们 自己 的 距离 向 量 。 令 人 惊奇 的 是 ， 只 要 
所 有 的 节点 继续 以 异步 方式 交换 它们 的 距离 向 量 ， 每 个 开销 估计 D.(y) 收敛 到 d.(y) ， 
d.(7) 为 从 节点 x 到 节点 y 的 实际 最 低 开 销路 径 的 开销 [ Bersekas 1991 ] ! 
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距离 向 量 (DV) 算法 
在 每 个 节点 x: 


1 Initialization: 

2 for all destinations y in N: 

S D, (y)= c(x,y)/* if y is not a neighbor then c(x,y)= œ */ 
4 for each neighbor w 

5 D,(y) = ? for all destinations y in N 

6 for each neighbor w 

7 send distance vector D, = [D (y): y in N] tow 

8 


10 wait (until I see a link cost change to some neighbor w or 
ri until I receive a distance vector from some neighbor w) 


13 for each y in N: 

14 D,(y) = min, {c(x,v) + D,(y)} 

15 

16 if Dx(y) changed for any destination y 

17 send distance vector D, = [D,(y): y in N] to all neighbors 
18 

19 forever 


在 该 DV 算法 中 ， 当 节点 x 发 现 它 的 直接 相连 的 链 路 开销 变化 或 从 某 个 邻居 接收 到 一 
个 距离 向 量 的 更 新 时 ， 它 就 更 新 其 距离 向 量 估计 值 。 但 是 为 了 一 个 给 定 的 目的 地 y 而 更 新 
它 的 转发 表 ， 节 点 x 真正 需要 知道 的 不 是 到 y 的 最 短路 径 距 离 ， 而 是 沿 着 最 短路 径 到 y 的 
下 一 跳 路 由 器 邻居 节点 v"(y) 。 如 你 可 能 期 望 的 那样 ， 下 一 跳 路 由 器 v* (y) 是 在 DV 算法 
第 14 行 中 取得 最 小 值 的 邻居 v。( 如 果 有 多 个 取得 最 小 值 的 邻居 v， 则 wv" (y) 能 够 是 其 中 
任何 一 个 有 最 小 值 的 邻居 。) 因此 ， 对 于 每 个 目的 地 y， 在 第 13 ~ 14 行 中 ， 节 点 * 也 决定 
v (y) 并 更 新 它 对 目的 地 y 的 转发 表 。 

前 面 讲 过 LS 算法 是 一 种 全 局 算法 ， 在 于 它 要 求 每 个 节点 在 运行 Dijkstra 算法 之 前 ， 首 
先 获得 该 网 络 的 完整 信息 。DV 算法 是 分 布 式 的 ， 它 不 使 用 这 样 的 全 局 信息 。 实 际 上 ， 节 
点 具有 的 唯一 信息 是 它 到 直接 相连 邻居 的 链 路 开销 和 它 从 这 些 邻 居 接 收 到 的 信息 。 每 个 节 
点 等 待 来 自任 何 邻 居 的 更 新 (第 10 ~ 11 行 )， 当 接收 到 一 个 更 新 时 计算 它 的 新 距离 向 量 
(第 14 行 ) 并 向 它 的 邻居 分 布 其 新 距离 向 量 (第 16 ~17 行 ) 。 在 实践 中 许多 类 似 DV 的 算 
法 被 用 于 多 种 路 由 选择 协议 中 ， 包 括 因特网 的 RIP 和 BGP, ISO IDRP、Novell IPX 和 早期 
的 ARPAnet。 

图 5-6 举例 说 明了 DV 算法 的 运行 ， 应 用 场合 是 该 图 顶部 有 三 个 节点 的 简单 网 络 。 算 
法 的 运行 以 同步 的 方式 显示 出 来 ， 其 中 所 有 节点 同时 从 其 邻居 接收 报 文 ， 计 算 其 新 距离 向 
量 ， 如 果 距 离 向 量 发 生 了 变化 则 通知 其 邻居 。 学 习 完 这 个 例子 后 ， 你 应 当 确 信 该 算法 以 异 
步 方式 也 能 正确 运行 ， 异步 方式 中 可 在 任意 时 刻 出 现 节点 计算 与 更 新 的 产生 /接收 。 

该 图 最 左边 一 列 显示 了 这 3 个 节点 各 自 的 初始 路 由 选择 表 (routing table) 。 例 如 ， 位 
于 左上 角 的 表 是 节点 % 的 初始 路 由 选择 表 。 在 一 张 特 定 的 路 由 选择 表 中 ， 每 行 是 一 个 距离 
向 量 一 一 特别 是 每 个 节点 的 路 由 选择 表 包 括 了 它 的 距离 向 量 和 它 的 每 个 邻居 的 距离 向 量 。 
因此 ， 在 节点 x 的 初始 路 由 选择 表 中 的 第 一 行 是 D, =[D.(*)，D.(y)，D.(z)] =[0，2， 
7]。 在 该 表 的 第 二 和 第 三 行 是 最 近 分 别 从 节点 y 和 z 收 到 的 距离 向 量 。 因 为 在 初始 化 时 节 
点 x 还 没有 从 节点 y Az 收 到 任何 东西 ， 所 以 第 二 行 和 第 三 行 表 项 中 被 初始 化 为 无 穷 大 。 

初始 化 后 ， 每 个 节点 向 它 的 两 个 邻居 发 送 其 距离 向 量 。 图 5-6 中 用 从 表 的 第 一 列 到 表 
的 第 二 列 的 箭头 说 明了 这 一 情况 。 例 如 ， 节 点 x 向 两 个 节点 y 和 zz 发 送 了 它 的 距离 向 量 
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D, =[0,2,7]。 在 接收 到 该 更 新 后 ， 每 个 节点 重新 计算 它 自己 的 距离 向 量 。 例 如 ， 节 点 
x 计算 

D.(x) =0 

D,(y) =min|e(x,y) + D,(y) ,c(x,z) + D,(y)} = min{2 +0,7 +1} =2 

D,(z) =min|c(x,y) + D,(z) ,c(x,z) + D,(z)} = min{2 +1,7 +0} =3 

第 二 列 因 此 为 每 个 节点 显示 了 节点 的 新 距离 向 量 连同 刚 从 它 的 邻居 接收 到 的 距离 向 

量 。 注 意 到 ， 例 如 节点 x 到 节点 z 的 最 低 开 销 估计 了 .(z) 已 经 从 7 变 成 了 3。 还 应 注意 到 ， 
对 于 节点 x， 节 点 7 在 该 DV 算法 的 第 14 行 中 取得 了 最 小 值 ; 因此 在 该 算法 的 这 个 阶段 ， 
我 们 在 节点 x 得 到 了 wv*(y) =y Mv" (z) =y。 





5-6 DV 算法 


在 节点 重新 计算 它们 的 距离 向 量 之 后 ， 它 们 再 次 向 其 邻居 发 送 它们 的 更 新 距离 向 量 
(如 果 它 们 已 经 改变 的 话 ) 。 图 5-6 中 由 从 表 第 二 列 到 表 第 三 列 的 箭头 说 明了 这 一 情况 。 注 
意 到 仅 有 节点 x 和 节点 z 发 送 了 更 新 ; 节点 y 的 距离 向 量 没 有 发 生变 化 ， 因 此 节点 y 没有 
发 送 更 新 。 在 接收 到 这 些 更 新 后 ， 这 些 节点 则 重新 计算 它们 的 距离 向 量 并 更 新 它们 的 路 由 
选择 表 ， 这 些 显示 在 第 三 列 中 。 
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从 邻居 接收 更 新 距离 向 量 、 重 新 计算 路 由 选择 表 项 和 通知 邻居 到 目的 地 的 最 低 开销 路 
径 的 开销 已 经 变化 的 过 程 继续 下 去 ， 直 到 无 更 新 报 文 发 送 为 止 。 在 这 个 时 候 ， 因 为 无 更 新 
报 文 发 送 ， 将 不 会 出 现 进一步 的 路 由 选择 表 计 算 ， 该 算法 将 进入 静止 状态 ， 即 所 有 的 节点 
将 执行 DV 算法 的 第 10 ~11 行 中 的 等 待 。 该 算法 停留 在 静止 状态 ， 直 到 一 条 链 路 开销 发 生 
改变 ， 如 下 面 所 讨论 的 那样 。 
1. 距离 向 量 算法 : 链 路 开销 改变 与 链 路 故障 
当 一 个 运行 DV 算法 的 节点 检测 到 从 它 自 己 到 邻居 的 链 路 开销 发 生变 化 时 (第 10 ~11 
行 )， 它 就 更 新 其 距离 向 量 (第 13 ~ 14 
行 )， 并 且 如 果 最 低 开销 路 径 的 开销 发 生 了 
变化 ， 向 邻居 通知 其 新 的 距离 向 量 (第 
16~17 行 )。 图 5-7a 图 示 了 从 y 到 4% 的 链 “和 
路 开销 从 4 变 为 1 的 情况 。 我 们 在 此 只 关 s: t) 
注 y 与 z 到 目的 地 x 的 距离 表 中 的 有 关 表 图 5-7 链 路 开销 改变 
项 。 该 DV 算法 导致 下 列 事件 序列 的 出 现 : 
© 在 to 时刻,，y 检测 到 链 路 开销 变化 (开销 从 4 变 为 1) ， 更 新 其 距离 向 量 ， 并 通知 其 
邻居 这 个 变化 ， 因 为 最 低 开销 路 径 的 开销 已 改变 。 
e 在 4 时刻，z 收 到 来 自 y 的 更 新 报 文 并 更 新 了 其 距离 表 。 它 计算 出 到 x 的 新 最 低 开 
销 (从 开销 5 减 为 开销 2) ， 它 向 其 邻居 发 送 了 它 的 新 距离 向 量 。 
e 在 时刻，y KAKA z 的 更 新 并 更 新 其 距离 表 。y 的 最 低 开 销 未 变 ， 因 此 y 不 发 
送 任何 报 文 给 z。 该 算法 进入 静止 状态 。 
因此 ， 对 于 该 DV 算法 只 需 两 次 迭代 就 到 达 了 静止 状态 。 在 % y 之 间 开 销 减少 的 好 
消息 通过 网 络 得 到 了 迅速 传播 。 
我 们 现在 考虑 一 下 当 某 链 路 开销 增加 时 发 生 的 情况 。 假 设 x 与 y 之 间 的 链 路 开销 从 4 
增加 到 60, ， 如 图 5-7b Pras. 
1) 在 链 路 开销 变化 之 前 ，D,(x) =4, D,(z) =1, Dy) =1 和 D.(x) =5。 FE ITA, 
7 检测 到 链 路 开销 变化 (开销 从 4 变 为 60)。y 计算 它 到 x 的 新 的 最 低 开销 路 径 的 开销 ， 其 
值 为 





D,(«) = min{e(y,x) + D,(x) ,e(y,z) + D(x)} = min{60 +0,1 +5} =6 

当然 ， 从 网 络 全 局 的 视角 来 看 ， 我 们 能 够 看 出 经 过 z 的 这 个 新 开销 是 错误 的 。 但 节点 
y 仅 有 的 信息 是 : 它 到 % MARAE OO, Hz 上 次 已 告诉 yx, z 能 以 开销 5 到 x。 因 此 ， 
HTAA x, y 将 通过 z 路 由 ， 完 全 期 望 z 能 以 开销 5 到 达 x。 到 了 4 时刻， 我 们 遇 到 路 由 
选择 环 路 (routing loop) ， 即 为 到 达 x，y 通过 z 路由， ee 路 由 选择 环 路 就 像 

一 个 黑洞 ， 即 目的 地 为 x 的 分 组 在 t 时 刻 到 达 y 或 z 后 ， 将 在 这 两 个 节点 之 间 不 停 地 (或 

直到 转发 表 发 生 改 变 为 止 ) 来 回 反复 。 

2) 因为 节点 y 已 算出 到 的 新 的 最 低 开销 ， 它 在 时 刻 将 该 新 距离 向 量 通知 zo 

3) Æt 后 某 个 时 间 ，z 收 到 y 的 新 距离 向 量 ， 它 指示 了 y 到 % 的 最 低 开销 是 6。z 知道 
它 能 以 开销 1 到 达 y， 因 此 计算 出 到 % 的 新 最 低 开 销 D,(x) =min|50 +0，1 +6| =7。 因 为 
z 到 x 的 最 低 开销 已 增加 了 ， 于 是 它 便 在 与 时 刻 通知 y 其 新 开销 。 

4) 以 类 似 方 式 ， 在 收 到 z 的 新 距离 向 量 后 ，y 决定 D,(x) =8 并 向 z 发 送 其 距离 向 量 。 
接 下 来 z 确 定 D,(x) =9 并 向 y 发送 其 距离 向 量 ， 等 等 。 
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该 过 程 将 要 继续 多 久 呢 ?你 应 认识 到 该 循环 将 持续 44 次 迭代 (在 y 与 z 之 间 交 换 报 
X), MAER: 最 终 算出 它 经 由 y 的 路 径 开 销 大 于 50 为 止 。 此 时 , z 将 (最 终 ) 确定 它 到 % 
的 最 低 开销 路 径 是 经 过 它 到 x 的 直接 连接 。y 将 经 由 z 路 由 选择 到 x。 关 于 链 路 开销 增加 的 
坏 消息 的 确 传播 得 很 慢 ! 如 果 链 路 开销 c(y, x) 从 4 变 为 10 000 且 开 销 e(z, x) 为 9999 
时 将 发 生 什么 样 的 现象 呢 ? 由 于 这 种 情况 ， 我 们 所 见 的 问题 有 时 被 称 为 无 穷 计数 ( count- 
to-infinity) 问题 。 

2. 距离 向 量 算法 : 增加 毒性 逆转 

刚才 描述 的 特定 循环 的 场景 可 以 通过 使 用 一 种 称 为 毒性 逆转 (poisoned reverse) 的 技 
术 而 加 以 避免 。 其 思想 较为 简单 :如果 z 通过 y 路 由 选择 到 目的 地 x， 则 z 将 通告 y， 它 
( 即 z) 到 x 的 距离 是 无 穷 大 ， 也 就 是 z 将 向 y 通告 D.(x) =o (即使 z 实 际 上 知道 D,(%) = 
5)。 只 要 z 经 y 路 由 选择 到 x，z 就 持续 地 向 y 讲述 这 个 善意 的 小 谎言 。 因 为 y 相信 z 没 有 
Bl x 的 路 径 ， 故 只 要 z 继续 经 y 路 由 选择 到 x (并 这 样 去 撒谎 ) ，y 将 永远 不 会 试图 经 由 = 
路 由 选择 到 x。 

我 们 现在 看 一 下 毒性 逆转 如 何 解 决 我 们 前 面 在 图 5-7b 中 遇 到 的 特定 环 路 问题 。 作 为 
毒性 逆转 的 结果 ，y 的 距离 表 指示 了 D.(x) =o 。 当 -(x，7y) 链 路 的 开销 在 t 时 刻 从 4 变 
为 60 HY, y 更 新 其 表 ， 虽 然 开 销 高 达 60， 仍 继续 直接 路 由 选择 到 x， 并 将 到 x 的 新 开销 通 
知 z， 即 D,(x) =60。z Æt 时 刻 收 到 更 新 后 ， 便 立即 将 其 到 x 的 路 由 切换 到 经 过 开销 为 50 
的 直接 (z, x) 链 路 。 因 为 这 是 一 条 新 的 到 x 的 最 低 开销 路 径 ， 且 因为 路 径 不 再 经 过 y，z 
就 在 时 刻 通知 y 现 在 D,(x) =50。 在 收 到 来 自 z 的 更 新 后 ,7 EH D, (x) =51 更 新 其 距 
离 表 。 男 外 ， 因 为 z 此 时 位 于 y 到 % 的 最 低 开销 路 径 上 ， 所 以 y 通过 在 4 时刻 通 知 z 其 
D,(x) =% (即使 y 实际 上 知道 D,(x) =51) 毒化 从 z 到 «的 逆向 路 径 。 

毒性 逆转 解决 了 一 般 的 无 穷 计 数 问题 吗 ? 没有 。 你 应 认识 到 涉及 3 个 或 更 多 节点 (而 
不 只 是 两 个 直接 相连 的 邻居 节点 ) 的 环 路 将 无 法 用 毒性 逆转 技术 检测 到 。 

3. LS 与 DV 路 由 选择 算法 的 比较 


DV 和 LS 算法 采用 互补 的 方法 来 解决 路 由 选择 计算 问题 。 在 DV 算法 中 ， 每 个 节点 仅 
与 它 的 直接 相连 的 邻居 交谈 ， 但 它 为 其 邻居 提供 了 从 它 自 己 到 网 络 中 〈 它 所 知道 的 ) 所 有 
其 他 节点 的 最 低 开 销 佑 计 。ILS 算法 需要 全 局 信息 。 因 此 ， 当 在 每 台 路 由 器 中 实现 时 ， 例 
如 像 在 图 4-2 和 图 5-1 中 那样 ， 每 个 节点 -( 经 广播 ) 与 所 有 其 他 节点 通信 ， 但 仅 告诉 它们 
与 它 直 接 相 连 链 路 的 开销 。 我 们 通过 快速 比较 它们 各 自 的 属性 来 总 结 所 学 的 链 路 状态 与 距 
离 向 量 算法 。 记 住 Y 是 节点 〈 路 由 器 ) WEA, MEH (R) 的 集合 。 

e 报 文 复杂 性 。 我 们 已 经 看 到 LS 算法 要 求 每 个 节点 都 知道 网 络 中 每 条 链 路 的 开销 。 
这 就 要 求 要 发 送 0(|N || E |) 个 报 文 。 而 且 无 论 何 时 一 条 链 路 的 开销 改变 时 ， 必 
须 向 所 有 节点 发 送 新 的 链 路 开销 。DV 算法 要 求 在 每 次 迭代 时 ， 在 两 个 直接 相连 邻 
居 之 间 交 换 报 文 。 我 们 已 经 看 到 ， 算 法 收敛 所 需 时 间 依 赖 于 许多 因素 。 当 链 路 开销 
改变 时 ，DV 算法 仅 当 在 新 的 链 路 开销 导致 与 该 链 路 相连 节点 的 最 低 开 销路 径 发 生 
改变 时 ， 才 传播 已 改变 的 链 路 开销 。 
收敛 速度 。 我们 已 经 看 到 LS 算法 的 实现 是 一 个 要 求 0(|N | |E |) 个 报 文 的 
0(|1N| ) 算 法 。DV 算法 收敛 较 慢 ， 且 在 收敛 时 会 遇 到 路 由 选择 环 路 。DV 算法 还 
会 遭遇 无 穷 计数 的 问题 。 
e 健 半 性 。 如 果 一 台 路 由 器 发 生 故 障 、 行 为 错乱 或 受到 蓄意 破坏 时 情况 会 怎样 呢 ? 对 
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于 LS 算法 ， 路 由 器 能 够 向 其 连接 的 链 路 (而 不 是 其 他 链 路 ) 广播 不 正确 的 开销 。 
作为 LS 广播 的 一 部 分 ,一 个 节点 也 可 损坏 或 丢弃 它 收 到 的 任何 LS 广播 分 组 。 但 是 
一 个 LS 节点 仅 计算 自己 的 转发 表 ; 其 他 节点 也 自行 执行 类 似 的 计算 。 这 就 意味 着 
在 LS 算法 下 ， 路 由 计算 在 某 种 程度 上 是 分 离 的 ， 提 供 了 一 定 程度 的 健壮 性 。 在 DV 
算法 下 ， 一 个 节点 可 向 任意 或 所 有 目的 节点 通告 其 不 正确 的 最 低 开 销路 径 。 (在 
1997 年 ,一 个 小 ISP 的 一 台 有 故障 的 路 由 器 的 确 向 美国 的 主干 路 由 器 提供 了 错误 的 
路 由 选择 信息 。 这 引起 了 其 他 路 由 器 将 大 量 流量 引 向 该 故障 路 由 器 ， 并 导致 因特网 
的 大 部 分 中 断 连接 达 数 小 时 [Neumann 1997],) 更 一 般 地 ， 我 们 会 注意 到 每 次 迭 
AREY, 在 DV 算法 中 一 个 节点 的 计算 会 传递 给 它 的 邻居 ， 然 后 在 下 次 迭代 时 再 间接 
地 传递 给 邻居 的 邻居 。 在 此 情况 下 ，DV 算法 中 一 个 不 正确 的 节点 计算 值 会 扩散 到 
整个 网 络 。 
总 之 ， 两 个 算法 没有 一 个 是 明显 的 赢家 ， 它 们 的 确 都 在 因特网 中 得 到 了 应 用 。 


5. 3 因特网 中 自治 系统 内 部 的 路 由 选择 : OSPF 


在 我 们 至 今 为 止 的 算法 研究 中 ， 我们 将 网 络 只 看 作 一 个 互联 路 由 器 的 集合 。 从 所 有 路 
由 器 执行 相同 的 路 由 选择 算法 以 计算 穿越 整个 网 络 的 路 由 选择 路 径 的 意义 上 来 说 ， 一 台 路 
由 器 很 难 同 另 一 台 路 由 器 区 别 开 来 。 在 实践 中 ， 该 模型 和 这 种 一 组 执行 同样 路 由 选择 算法 
的 同 质 路 由 器 集合 的 观点 有 一 点 简单 化 ， 有 以 下 两 个 重要 原因 : 

© 规模 。 随 着 路 由 器 数目 变 得 很 大 ， 涉 及 路 由 选择 信息 的 通信 、 计 算 和 存储 的 开销 将 
高 得 不 可 实现 。 当 今 的 因特网 由 数 亿 台 主 机 组 成 。 在 这 些 主机 中 存储 的 路 由 选择 信 
息 显然 需要 巨大 容量 的 内 存 。 在 所 有 路 由 器 之 间 广 播 连通 性 和 链 路 开销 更 新 所 要 求 
的 负担 将 是 巨大 的 ! 在 如 此 大 量 的 路 由 器 中 迭代 的 距离 向 量 算法 将 肯定 永远 无 法 收 
SHY 显然 ， 必 须 采 取 一 些 措施 以 减少 像 因 特 网 这 种 大 型 网 络 中 的 路 由 计算 的 复 
杂 性 。 
管理 自治 。 如 在 1.3 节 描 述 的 那样 ， 因 特 网 是 ISP 的 网 络 ， 其 中 每 个 ISP 都 有 它 自 
己 的 路 由 器 网 络 。ISP 通常 希望 按 自己 的 意愿 运行 路 由 器 《如 在 自己 的 网 络 中 运行 
它 所 选择 的 某 种 路 由 选择 算法 )， 或 对 外 部 隐藏 其 网 络 的 内 部 组 织 面貌 。 在 理想 情 
况 下 ， 一 个 组 织 应 当 能 够 按 自己 的 愿望 运行 和 管理 其 网 络 ， 还 要 能 将 其 网 络 与 其 他 
外 部 网 络 连接 起 来 。 

这 两 个 问题 都 可 以 通过 将 路 由 器 组 织 进 自治 系统 (Autonomous System, AS) 来 解决 ， 
其 中 每 个 AS 由 一 组 通常 处 在 相同 管理 控制 下 的 路 由 器 组 成 。 通 常 在 一 个 ISP 中 的 路 由 器 
以 及 互联 它们 的 链 路 构成 一 个 AS。 然 而 ， 某 些 ISP 将 它们 的 网 络 划分 为 多 个 AS。 特 别 是 ， 
某 些 一 级 ISP 在 其 整个 网 络 中 使 用 一 个 庞大 的 AS， 而 其 他 ISP 则 将 它们 的 ISP 拆 分 为 数 十 
个 互联 的 AS。 一 个 自治 系统 由 其 全 局 唯一 的 AS (ASN) 所 标识 [RFC 1930] 。 就 像 人’ 
地 址 那样 ，AS 号 由 ICANN 区 域 注册 机 构 所 分 配 [ICANN 2016] 。 

在 相同 AS 中 的 路 由 器 都 运行 相同 的 路 由 选择 算法 并 且 有 彼此 的 信息 。 在 一 个 自治 系 
统 内 运行 的 路 由 选择 算法 叫 作 自治 系统 内 部 路 由 选择 协议 (intra- autonomous system routing 


protocol) 。 


开放 最 短路 优先 (OSPF) 
OSPF 路 由 选择 及 其 关系 密切 的 协议 IS-IS 都 被 广泛 用 于 因特网 的 AS 内 部 路 由 选 
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择 。OSPF 中 的 开放 (open) 一 词 是 指 路 由 选择 协议 规范 是 公众 可 用 的 (与 之 相反 的 
是 Cisco 的 EIGRP 协议 ， 该 协议 在 最 近 才 成 为 开放 的 [Savage 2015 ] ， 它 作为 Cisco 专 
用 协议 大 约 有 20 年 时 间 ) 。OSPF 的 最 新 版 本 是 版 本 2， 由 [RFC 2328] 这 个 公用 文 
档 所 定义 。 

OSPF 是 一 种 链 路 状态 协议 ， 它 使 用 洪 泛 链 路 状态 信息 和 Dijkstra 最 低 开 销路 径 算法 。 
使 用 OSPF， 一 人 台 路 由 器 构建 了 一 幅 关 于 整个 自治 系统 的 完整 拓扑 图 ( 即 一 幅 图 ) 。 于 是 ， 
每 台 路 由 器 在 本 地 运行 Dijkstra 的 最 短路 径 算 法 ， 以 确定 一 个 以 自身 为 根 节点 到 所 有 子 网 
的 最 短路 径 树 。 各 条 链 路 开销 是 由 网 络 管理 员 配 置 的 (参见 “实践 原则 : 设置 OSPF 链 路 
权 值 ” ) 。 管 理 员 也 许 会 选择 将 所 有 链 路 开销 设 为 1， 因而 实现 了 最 少 跳 数 路 由 选择 ， 或 者 
可 能 会 选择 将 链 路 权 值 按 与 链 路 容量 成 反比 来 设置 ， 从 而 不 鼓励 流量 使 用 低 带 宽 链 路 。 
OSPF 不 强制 使 用 设置 链 路 权 值 的 策略 ( 那 是 网 络 管理 员 的 任务 )， 而 是 提供 了 一 种 机 制 
(协议 ) ， 为 给 定 链 路 权 值 集合 确定 最 低 开 销路 径 的 路 由 选择 。 

使 用 OSPF 时 ， 路 由 器 向 自治 系统 内 所 有 其 他 路 由 器 广播 路 由 选择 信息 ， 而 不 仅仅 是 
向 其 相 邻 路 由 器 广播 。 每 当 一 条 链 路 的 状态 发 生变 化 时 【如 开销 的 变化 或 连接 /中 断 状 态 

的 变化 )， 路 由 器 就 会 广播 链 路 状态 信息 。 即 使 链 路 状态 未 发 生变 化 ， 它 也 要 周期 性 地 
(至 少 每 隔 30 min 一 次 ) 广播 链 路 状态 。RFC 2328 中 有 这 样 的 说 明 :“ 链 路 状态 通告 的 这 
种 周期 性 更 新 增加 了 链 路 状态 算法 的 健壮 性 。” OSPF 通告 包含 在 OSPF 报 文中 ,该 OSPF 
报 文 直接 由 IP 承载 ， 对 OSPF 其 上 层 协议 的 值 为 89。 因 此 OSPF 协议 必须 自己 实现 诸如 可 
靠 报 文 传输 、 链 路 状态 广播 等 功能 。0SPF 协议 还 要 检查 链 路 正在 运行 (通过 向 相连 的 邻 
居 发 送 HELLO 报 文 ) ， 并 允许 OSPF 路 由 器 获得 相 邻 路 由 器 的 网 络 范围 链 路 状态 的 数 
据 库 。 

OSPF 的 优点 包括 下 列 几 方面 : 

e 安全 。 能 够 鉴别 OSPF 路 由 器 之 间 的 交换 (如 链 路 状态 更 新 ) 。 使 用 鉴别 ， 仅 
有 受信 任 的 路 由 器 能 参与 一 个 AS 内 的 OSPF 协议 ， 因 此 可 防止 恶意 入侵 者 
(或 正在 利用 新 学 的 知识 到 处 试探 的 网 络 专业 的 学 生 ) 将 不 正确 的 信息 注入 路 
由 器 表 内 。 在 默认 状态 下 ， 路 由 器 间 的 OSPF 报 文 是 未 被 鉴别 的 并 能 被 伪造 。 
能 够 配置 两 类 鉴别 ， 即 简单 的 和 MDS 的 (参见 第 8 BASE MDS 和 鉴别 的 一 般 
性 讨论 ) 。 使 用 简单 的 鉴别 ,每 台 路 由 器 配置 相同 的 口令 。 当 一 台 路 由 器 发 送 
一 个 OSPF 分 组 ， 它 以 明文 方式 包括 了 口令 。 显 然 ， 简 单 鉴 别 并 不 是 非常 安全 。 
MDS 鉴别 基于 配置 在 所 有 路 由 器 上 的 共享 秘密 密 钥 。 对 发 送 的 每 个 OSPF 分 
组 ， 路 由 器 对 附加 了 秘密 密 钥 的 OSPF 分 组 内 容 计 算 MDS 散 列 值 (参见 第 8 章 
中 报 文 鉴别 码 的 讨论 ) 。 然 后 路 由 器 将 所 得 的 散 列 值 包括 在 该 OSPF 分 组 中 。 
接收 路 由 器 使 用 预 配置 的 秘密 密 钥 计算 出 该 分 组 的 MD5 散 列 值 ， 并 与 该 分 组 
携带 的 散 列 值 进行 比较 ， 从 而 验证 了 该 分 组 的 真实 性 。 在 MD5 鉴别 中 也 使 用 
了 序号 对 重 放 攻 击 进 行 保护 。 

多 条 相同 开销 的 路 径 。 当 到 达 某 目的 地 的 多 条 路 径 具 有 相同 的 开销 时 ，OSPF 允许 
使 用 多 条 路 径 (这 就 是 说 ， 当 存在 多 条 相等 开销 的 路 径 时 ， 无 须 仅 选择 单一 的 路 径 
来 承载 所 有 的 流量 ) 。 

对 单 播 与 多 播 路 由 选择 的 综合 支持 。 多 播 0SPF (MOSPF) [RFC 1584] 提供 对 OS- 
PF 的 简单 扩展 ， 以 便 提供 多 播 路 由 选择 。MOSPF 使 用 现 有 的 OSPF 链 路 数据 库 ， 
并 为 现 有 的 OSPF 链 路 状态 广播 机 制 增加 了 一 种 新 型 的 链 路 状态 通告 。 
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日 支持 在 单个 AS 中 的 层次 结构 。 一 个 OSPF 自治 系统 能 够 层次 化 地 配置 多 个 区 域 。 
每 个 区 域 都 运行 自己 的 OSPF 链 路 状态 路 由 选择 算法 ， 区 域内 的 每 台 路 由 器 都 向 该 
区 域内 的 所 有 其 他 路 由 器 广播 其 链 路 状态 。 在 每 个 区 域内 ， 一 台 或 多 台 区 域 边界 路 
由 器 负责 为 流向 该 区 域 以 外 的 分 组 提供 路 由 选择 。 最 后 ,在 AS 中 只 有 一 个 OSPF 
区 域 配置 成 主干 区 域 。 主 干 区域 的 主要 作用 是 为 该 AS 中 其 他 区 域 之 间 的 流量 提供 
路 由 选择 。 该 主干 总 是 包含 本 AS 中 的 所 有 区 域 边界 路 由 器 ， 并 且 可 能 还 包含 了 一 
些 非 边 界 路 由 器 。 在 AS 中 的 区 域 间 的 路 由 选择 要 求 分 组 先 路 由 到 一 个 区 域 边界 路 
由 器 (区 域内 路 由 选择 ) ， 然 后 通过 主干 路 由 到 位 于 目的 区 域 的 区 域 边界 路 由 器 ， 
进而 再 路 由 到 最 终 目 的 地 。 

OSPF 是 一 个 相当 复杂 的 协议 ， 而 我 们 这 里 的 讨论 是 十 分 简要 的 ， [ Huitema 1998; 

Moy 1998; RFC 2328] 提供 了 更 多 的 细节 。 
















设置 OSPF 链 路 权 值 


我 们 有 关 链 路 状态 路 由 选择 的 讨论 隐 含 地 假设 了 下 列 事实 ; 链 路 权重 已 经 设置 好 | 
T, 运行 诸如 OSPF 这 样 的 路 由 选择 算法 ， 流 量 根据 由 LS 算法 计算 所 得 的 路 由 选择 表 流 
动 。 就 因果 而 言 ， 给 定 链 路 权重 ( 即 它们 先 发 生 )， 结 果 得 到 (经 Dijkstra 算法 ) 最 小 | 
化 总 体 开 销 的 路 由 选择 路 径 。 从 这 个 角度 看 ， 链 路 权重 反映 了 使 用 一 条 链 路 的 开销 ( 例 | 
如 ， 如 果 链 路 权重 与 容量 成 反比 ， 则 使 用 高 容量 链 路 将 具有 较 小 的 权重 并 因此 从 路 由 先 
择 的 角度 更 有 吸引 力 ) ， 并 且 使 用 Dijkstra 算法 使 得 总 开销 为 最 小 。 | 

在 实践 中 ， 链 路 权重 和 路 由 选择 路 径 之 间 的 因果 关系 也 许 是 相反 的 ， 网 络 操作 员 配 | 
置 链 路 权重 ， 以 获取 某 些 流量 工程 目标 的 路 由 选择 路 径 [Fortz 2000; Fortz 2002], 4 
如 ， 假 设 某 网 络 操作 员 具 有 在 每 个 入 口 点 进入 和 发 向 每 个 出 口 点 的 该 网 络 的 流量 估计 。 
该 操作 员 接 下 来 可 能 要 设置 特定 入 口 到 出 口 的 流 路 由 选择 ， 以 最 小 化 经 所 有 网 络 链 路 的 
最 大 利用 率 。 但 使 用 如 OSPF 这 样 的 路 由 选择 算法 ， 操 作 员 调节 网 络 流 的 路 由 选择 的 主 
要 手段 就 是 链 路 权重 。 因 此 ， 为 了 取得 最 小 化 最 大 链 路 利用 率 的 目标 ， 操 作 员 必 须 找 出 
取得 该 目标 的 链 路 权重 集合 。 这 是 一 种 相反 的 因果 关系 ， 即 所 希望 的 流 路 由 选择 已 知 ， 
必须 找到 OSPF 链 路 权重 ， 使 得 该 OSPF 路 由 选择 算法 导致 这 种 希望 的 流 路 由 选择 。 | 








5.4 ISP 之 间 的 路 由 选择 : BGP 


我 们 刚才 学 习 了 OSPF 是 一 个 AS 内 部 路 由 选择 协议 。 当 在 相同 AS 内 的 源 和 目的 地 之 
间 进 行 分 组 选 路 时 ， 分 组 遵循 的 路 径 完 全 由 AS 内 路 由 选择 协议 所 决定 。 然 而 ， 当 分 组 跨 
越 多 个 AS 进行 路 由 时 ， 比 如 说 从 位 于 马里 廷 巴克 图 的 智能 手机 到 位 于 美国 硅谷 数据 中 心 
的 一 台 服 务 器 ， 我 们 需要 一 个 自治 系统 间 路 由 选择 协议 (inter- autonomous system routing 
protocol) 。 因 为 AS 间 路 由 选择 协议 涉及 多 个 AS 之 间 的 协调 ， 所 以 AS 通信 必须 运行 相同 
的 AS 间 路 由 选择 协议 。 在 因特网 中 ， 所 有 的 AS 运行 相同 的 AS 间 路 由 选择 协议 ， 称 为 边 
界 网 关 协 议 (Broder Gateway Protocol, BGP) [RFC 4271; Stewart 1999 ] 。 

BGP 无 疑 是 所 有 因特网 协议 中 最 为 重要 的 (唯一 竞争 者 可 能 是 我 们 已 经 在 4.3 节 中 学 


ABE: Fi) Fa 257 





习 的 中 协议 )， 因 为 正 是 这 个 协议 将 因特网 中 数 以 千 计 的 ISP 黏合 起 来 。 如 我 们 将 看 到 的 
AREF, BGP 是 一 种 分 布 式 和 异步 的 协议 ,与 5.2.2 节 中 描述 的 距离 向 量 路 由 选择 协议 一 脉 
相 承 。 尽 管 BGP 是 一 种 复杂 和 富有 挑战 性 的 协议 , 但 为 了 深层 次 理解 因特网 ， 我 们 需要 
熟悉 它 的 基础 结构 和 操作 。 我 们 专注 于 学 习 BGP 的 时 间 将 是 物 有 所 值 的 。 


5.4.1 BGP 的 作用 


为 了 理解 BGP 的 职责 所 在 ， 考 虑 一 个 AS 和 在 该 AS 中 的 任意 一 个 路 由 器 。 前 面 讲 过 ， 
每 台 路 由 器 具有 一 张 转 发 表 ， 该 转发 表 在 将 到 达 分 组 转发 到 出 路 由 器 链 路 的 过 程 中 起 着 主 
要 作用 。 如 我 们 已 经 学 习 过 的 那样 ， 对 于 位 于 相同 AS 中 的 目的 地 而 言 ， 在 路 由 器 转发 表 
中 的 表 项 由 AS 内 部 路 由 选择 协议 所 决定 。 而 对 于 位 于 该 AS 外 部 的 目的 地 而 言情 况 如 何 
呢 ? 这 正 是 BGP 用 武之 地 。 

在 BGP 中 ， 分 组 并 不 是 路 由 到 一 个 特定 的 目的 地 址 ， 相 反 是 路 由 到 CIDR 化 的 前 级 ， 
其 中 每 个 前 缀 表示 一 个 子 网 或 一 个 子 网 的 集合 。 在 BGP 的 世界 中 ， 一 个 目的 地 可 以 采用 
138. 16. 68/22 的 形式 ， 对 于 这 个 例子 来 说 包括 1024 个 卫 地 址 。 因 此 ， 一 台 路 由 器 的 转发 
表 将 具有 形式 为 (x，7) 的 表 项 ， 其 中 x% 是 一 个 前 缀 (例如 138. 16.68/22), 了 是 该 路 由 
器 的 接口 之 一 的 接口 号 。 

作为 一 种 AS 间 的 路 由 选择 协议 ，BGP 为 每 台 路 由 器 提供 了 一 种 完成 以 下 任务 的 手段 : 

1) MARE AS 获得 前 组 的 可 达 性 信息 。 特 别 是 ，BGP 允许 每 个 子 网 向 因特网 的 其 余部 
分 通告 它 的 存在 。 一 个 子 网 高 声 宣布 “我 存在 ,我 在 这 里 ”， 而 BGP 确保 在 因特网 中 的 所 
有 AS 知道 该 子 网 。 如 果 没 有 BCP 的 话 ， 每 个 子 网 将 是 隔离 的 孤岛 ， 即 它们 孤独 地 存在 ， 
不 为 因特网 其 余部 分 所 知 和 所 达 。 

2) 确定 到 该 前 缓 的 “最 好 的 ”路 由 。 一 台 路 由 器 可 能 知道 两 条 或 更 多 条 到 特定 前 组 
的 不 同 路 由 。 为 了 确定 最 好 的 路 由 ， 该 路 由 器 将 本 地 运行 一 个 BGP 路 由 选择 过 程 (使 用 
它 经 过 相 邻 的 路 由 器 获得 的 前 缀 可 达 性 信息 ) 。 该 最 好 的 路 由 将 基于 策略 以 及 可 达 性 信息 
来 确定 。 

我 们 现在 钻研 BGP 如 何 执行 这 两 个 任务 。 


5. 4.2 通告 BGP 路 由 信息 


考虑 图 5-8 中 显示 的 网 络 。 如 我 们 看 到 的 那样 ， 这 个 简单 的 网 络 具 有 3 个 自治 系统 : 
AS1 AS2 和 AS3 。 如 显示 的 那样 ，AS3 包括 一 个 具有 前 级 x 的 子 网 。 对 于 每 个 AS， 每 台 
路 由 器 要 么 是 一 台 网 关 路 由 器 (gateway router) ， 要 么 是 一 台 内 部 路 由 器 (internal router) 。 
网 关 路 由 器 是 一 台 位 于 AS 边缘 的 路 由 器 ， 它 直接 连接 到 在 其 他 AS 中 的 一 台 或 多 台 路 由 
句 。 内 部 路 由 器 仅 连接 在 它 自己 AS 中 的 主机 和 路 由 器 。 例 如 ， 在 ASI 中 路 由 器 1c 是 网 关 
路 由 器 ; 路 由 器 la、1lb 和 1d 是 内 部 路 由 器 。 

我 们 考虑 这 样 一 个 任务 : 向 图 5-8 中 显示 的 所 有 路 由 器 通告 对 于 前 级 x% 的 可 达 性 信 
息 。 在 高 层次 上 ， 这 是 简明 易 懂 的 。 首 先 ，AS3 向 AS2 发 送 一 个 BGP 报 文 ， 告 知 x 存在 
并 且 位 于 AS3 中 ; 我 们 将 该 报 文 表示 为 “AS3 x”。 然 后 AS2 向 AS] 发 送 一 个 BGP 报 文 ， 
告知 x 存在 并 且 能 够 先 通 过 AS2 然后 进入 AS3 进而 到 达 x; 我 们 将 该 报 文 表 示 为 “AS2 
AS3 x”。 以 这 种 方式 ， 每 个 自治 系统 不 仅 知 道 x 的 存在 ， 而 且 知道 通 向 x 的 自治 系统 的 
路 径 。 
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ASI AS3 
图 5-8 具有 3 个 自治 系统 的 网 络 。AS3 包括 一 个 具有 前 级 x 的 子 网 


虽然 在 图 5-8 中 有 关 通 告 BGP 可 达 性 信息 的 讨论 能 得 到 路 径 穿 越 的 大 意 ， 但 就 自治 系 
统 彼此 并 未 实际 发 送 报 文 而 言 ， 它 并 不 是 准确 的 ， 相 反 是 路 由 器 在 发 送 报 文 。 为 了 理解 这 
一 点 ， 我 们 现在 重 温 图 5-8 中 的 例子 。 在 BGP 中 ， 每 对 路 由 器 通过 使 用 179 端口 的 半 永 入 
TCP 连接 交换 路 由 选择 信息 。 每 条 直接 连接 以 及 所 有 通过 该 连接 发 送 的 BGP 报 文 ， 称 为 
BGP 连接 (BGP connection), 。 此 外 ， 跨 越 两 个 AS 的 BGP 连接 称 为 外 部 BGP (eBGP) 连 
接 ， 而 在 相同 AS 中 的 两 台 路 由 器 之 间 的 BGP 会 话 称 为 内 部 BGP (iBGP) 连接 。 图 5-8 
所 示 网 络 的 BGP 连接 的 例子 显示 在 图 5-9 中 。 对 于 直接 连接 在 不 同 AS 中 的 网 关 路 由 器 的 
每 条 链 路 而 言 ， 通 常 有 一 条 eBGP 连接 ; 因此 ， 在 图 5-9 中 ,在 网 关 路 由 器 lc 和 2a 之 间 
有 一 条 eBGP 连接 ， 而 在 网 关 路 由 器 2c 和 3a 之 间 也 有 一 条 eBGP 连接 。 

在 每 个 AS 中 的 路 由 器 之 间 还 有 多 条 iBGP 连接 。 特 别 是 ， 图 5-9 显示 了 一 个 AS 内 部 
的 每 对 路 由 器 之 间 的 一 条 BGP 连接 的 通常 配置 ， 在 每 个 AS 内 部 产生 了 网 状 的 TCP 连接 。 
在 图 5-9 中 ，eBGP 会 话 显示 为 长 虚线 ，iBGP 显示 为 短 虚 线 。 注 意 到 iBGP 连接 并 不 总 是 与 
物理 链 路 对 应 。 





图 5-9 eBGP fil iBGP 连接 


为 了 传播 可 达 性 信息 ， 使 用 了 iBGP 和 eBGP 会 话 。 再 次 考虑 向 AS1 和 AS2 中 的 所 有 
路 由 器 通告 前 级 x 的 可 达 性 信息 。 在 这 个 过 程 中 ， 网 关 路 由 器 3a 先 向 网 关 路 由 器 2c 发 送 
一 个 eBGP 报 文 “AS3 x”。 网 关 路 由 器 2c 然后 向 AS2 中 的 所 有 其 他 路 由 器 (包括 网 关 路 
由 器 2a) 发 送 iBGP 报 文 “AS3 x”。 网 关 路 由 器 2a 接 下 来 向 网 关 路 由 器 le 发 送 一 个 eBGP 
报 文 “AS2 AS3 x”。 最 后 ， 网 关 路 由 器 1c 使 用 iBGP 向 ASI 中 的 所 有 路 由 器 发 送 报 文 
“AS2 AS3 x”。 在 这 个 过 程 完成 后 ， 在 AS1 和 AS2 中 的 每 个 路 由 器 都 知道 了 x 的 存在 并 且 
也 都 知道 了 通 往 x 的 AS 路 径 。 
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当然 ， 在 真实 的 网 络 中 ， 从 某 个 给 定 的 路 由 器 到 某 个 给 定 的 目的 地 可 能 有 多 条 不 同 的 路 
径 ， 每 条 通过 了 不 同 的 AS 序列 。 例 如 ， 考 虑 图 5-10 所 示 的 网 络 ， 它 是 在 图 5-8 那个 初始 网 
络 基础 上 ， 从 路 由 器 1d 到 路 由 器 3d 附加 了 一 条 物理 链 路 。 在 这 种 情况 下 ， 从 ASI 到 x 有 两 
条 路 径 : 经 过 路 由 器 le 的 路 径 “AS2 AS3 x”; 以 及 经 过 路 由 器 1d 的 新 路 径 “AS3 x” o 





ASI NEXT-HOP AS3 
图 5-10 在 ASl 和 AS3 之 间 增加 对 等 链 路 后 的 网 络 


5.4.3 确定 最 好 的 路 由 


如 我 们 刚才 学 习 到 的 那样 ， 从 一 个 给 定 的 路 由 器 到 一 个 目的 子 网 可 能 有 多 条 路 径 。 事 
实 上 ， 因 特 网 中 的 路 由 器 常常 接收 到 很 多 不 同 的 可 能 路 径 的 可 达 性 信息 。 一 台 路 由 器 如 何 
在 这 些 路 径 之 间 进 行 选择 〈 并 且 再 相应 地 配置 它 的 转发 表 ) YE? 

在 处 理 这 个 关键 性 问题 之 前 ， 我 们 需要 引入 几 个 BGP 术语 。 当 路 由 器 通过 BGP 连接 
通告 前 缀 时 ， 它 在 前 缀 中 包括 一 些 BGP 属性 (BGP attribute), H BCP 术语 来 说 ， 前 缀 及 
其 属性 称 为 路 由 (route)。 两 个 较为 重要 的 属性 是 AS-PATH 和 NEXT- HOP。AS-PATH 属 
性 包含 了 通告 已 经 通过 的 AS 的 列表 ， 如 我 们 在 前 面 的 例子 中 所 见 。 为 了 生成 AS-PATH 的 
值 ， 当 一 个 前 级 通过 某 AS 时 ， 该 AS 将 其 ASN 加 入 AS-PATH 中 的 现 有 列表 。 例 如 ， 在 图 
5-10 中 ， 从 ASI 到 子 网 x 有 两 条 路 : 其 中 一 条 使 用 AS-PATH “AS2 AS3”; 而 另 一 条 使 用 
AS-PATH “AS3”。BGP 路 由 器 还 使 用 AS-PATH 属性 来 检测 和 防止 通告 环 路 ; 特别 是 ， 如 
果 一 台 路 由 器 在 路 径 列 表 中 看 到 包含 了 它 自 己 的 AS， 它 将 拒绝 该 通告 。 

在 AS 间 和 AS 内 部 路 由 选择 协议 之 间 提 供 关键 链 路 方面 ，NEXT- PATH 属性 具有 敏感 
而 重要 的 作用 。NEXT-HOP 是 AS-PATH 起 始 的 路 由 器 接口 的 IP 地 址 。 为 了 深入 理解 该 属 
性 ， 我 们 再 次 参考 图 $-10。 如 图 5-10 中 所 指示 的 那样 ， 对 于 从 ASI 通过 AS2 到 x 的 路 由 
“AS2 AS3 x”， 其 属性 NEXT-HOP 是 路 由 器 2a AWE AY IP Hot, HFM ASI 绕 过 AS2 
Bll x 的 路 由 “AS3 x”, H NEXT-HOP 属性 是 路 由 器 3d 最 左边 接口 的 IP 地 址 。 总 的 说 来 ， 
在 这 个 假想 的 例子 中 ，AS1 中 的 每 台 路 由 器 都 知道 了 到 前 级 x 的 两 台 BGP 路 由 : 

路 由 器 2a 的 最 左 侧 接 口 的 下 地址 : AS2 AS3; x 
路 由 器 3d 的 最 左 侧 接口 的 四 地址: AS3; x 

这 里 ,每 条 BCP 路 由 包含 3 个 组 件 ; NEXT- HOP; ASPATH; 目的 前 级。 在 实践 中 ， 
一 条 BGP 路 由 还 包括 其 他 属性 ， 眼 下 我 们 将 暂且 忽略 它 。 注 意 到 NEXT- HOP 属性 是 不 属 
于 AS] 的 某 路 由 器 的 IP 地 址 ; 然而 ,包含 该 人 地 址 的 子 网 直接 连接 到 ASI 。 


1. 热土 豆 路 由 选择 


终于 到 了 以 精确 的 方式 来 讨论 BGP 路 由 选择 算法 的 时 刻 了 。 我 们 将 以 一 个 最 简单 的 
路 由 选择 算法 开始 ， 即 热土 豆 路 由 选择 ( hot potato routing) 。 
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考虑 在 图 5-10 网 络 中 的 路 由 器 lb。 如 同 刚才 所 述 ， 这 台 路 由 器 将 学 习 到 达 前 级 x 的 
两 条 BGP 路 由 。 使 用 热土 豆 路 由 选择 ，( 从 所 有 可 能 的 路 由 中 ) 选择 的 路 由 到 开始 该 路 由 
的 NEXT-HOP 路 由 器 具有 最 小 开销 。 在 这 个 例子 中 ， 路 由 器 lb 将 查阅 它 的 AS 内 部 路 由 
选择 信息 ， 以 找到 通 往 NEXT-HOP 路 由 器 2a 的 最 低 开 销 AS 内 部 路 径 以 及 通 往 NEXT-HOP 
路 由 器 3d 的 最 低 开 销 AS 间 路 径 ， 进 而 选择 这 些 最 低 开 销路 径 中 具有 最 低 开销 的 那 条 。 例 
如 ， 假 设 开销 定义 为 穿越 的 链 路 数 。 则 从 路 由 器 1b 到 路 由 器 2a 的 最 低 开销 是 2， 从 路 由 
器 1b 到 路 由 器 2d 的 最 低 开 销 是 3， 因 此 将 选择 路 由 器 2a。 路 由 器 Lb 则 将 查阅 它 的 转发 表 
(由 它 的 AS 内 部 算法 所 配置 ) ， 并 且 找到 通 往 路 由 器 2a 的 位 于 最 低 开销 路 径 上 的 接口 7。 
Ib WHE (x, 1) 加 到 它 的 转发 表 中 。 

5-11 中 总 结 了 在 一 台 路 由 器 转发 表 中 对 于 热土 豆 路 由 选择 增加 AS 向 外 前 组 的 步 
又 。 注 意 到 下 列 问题 是 重要 的 : 当 在 转发 表 中 增加 AS 向 外 前 缀 时 ，AS 间 路 由 选择 协议 





图 5-11 在 路 由 器 转发 表 中 增加 AS 外 部 目的 地 的 步骤 


热土 豆 路 由 选择 依据 的 思想 是 : 对 于 路 由 器 1b， 尽 可 能 快 地 将 分 组 送出 其 AS (EH 
确 地 说 ， 用 可 能 的 最 低 开 销 ) ， 而 不 担心 其 AS 外 部 到 目的 地 的 余下 部 分 的 开销 。 就 “ 热 
土豆 路 由 选择 ”名 称 而 言 ， 分 组 被 类 比 为 泌 手 的 热土 豆 。 因 为 它 汤 手 ， 你 要 尽 可 能 快 地 将 
它 传 给 另 一 个 人 “〈 另 一 个 AS) 。 热 土豆 路 由 选择 因而 是 自私 的 算法 ， 即 它 试 图 减 小 在 它 自 
己 AS 中 的 开销 ， 而 忽略 在 其 AS 之 外 的 端 到 端 开销 的 其 他 部 分 。 注 意 到 使 用 热土 豆 路 由 
选择 ， 对 于 在 相同 AS 中 的 两 台 路 由 器 ， 可 能 对 相同 的 前 缀 选择 两 条 不 同 的 AS 路 径 。 例 
如 ， 我 们 刚才 看 到 路 由 器 1b 到 达 x 将 通过 AS2 发 送 分 组 。 而 路 由 器 1d 将 绕 过 AS2 并 直接 
问 AS3 发 送 分 组 到 达 xo 

2. 路 由 器 选择 算法 

在 实践 中 ，BGP 使 用 了 一 种 比 热 土豆 路 由 选择 更 为 复杂 但 却 结合 了 其 特点 的 算法 。 对 
于 任何 给 定 的 目的 地 前 缀 ， 进 入 BGP 的 路 由 选择 算法 的 输入 是 到 某 前 级 的 所 有 路 由 的 集 
合 ， 该 前 级 是 已 被 路 由 器 学 习 和 接受 的 。 如 果 仅 有 一 条 这 样 的 路 由 ，BGP 则 显然 选择 该 路 
由 。 如 果 到 相同 的 前 级 有 两 条 或 多 条 路 由 ， 则 顺序 地 调用 下 列 消除 规则 直到 余下 一 条 
路 由 : 

1) 路 由 被 指派 一 个 本 地 偏好 (local preference) 值 作为 其 属性 之 一 〈 除 了 AS-PATH 和 
NEXT-HOP 以 外 ) 。 一 条 路 由 的 本 地 偏好 可 能 由 该 路 由 器 设置 或 可 能 由 在 相同 AS 中 的 另 一 台 
路 由 顺 学习 到 。 本 地 偏好 属性 的 值 是 一 种 策略 决定 ， 它 完全 取决 于 该 AS 的 网 络 管理 员 (我 
们 随后 将 更 为 详细 地 讨论 BGP 策略 问题 ) 。 具 有 最 高 本 地 偏好 值 的 路 由 将 被 选择 。 

2) 从 余下 的 路 由 中 (所 有 都 具有 相同 的 最 高 本 地 偏好 值 )， 将 选择 具有 最 短 AS- 
PATH 的 路 由 。 如 果 该 规则 是 路 由 选择 的 唯一 规则 ， 则 BGP 将 使 用 距离 向 量 算法 决定 路 
径 ， 其 中 距离 测度 使 用 AS 跳 的 跳 数 而 不 是 路 由 器 跳 的 跳 数 。 

3) 从 余下 的 路 由 中 (所 有 都 具有 相同 的 最 高 本 地 偏好 值 和 相同 的 AS- PATH 长 度 )， 
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使 用 热土 豆 路 由 选择 ， 即 选择 具有 最 靠近 NEXT- HOP 路 由 器 的 路 由 。 

4) 如 果 仍 留 下 多 条 路 由 ， 该 路 由 器 使 用 BGP 标识 符 来 选择 路 由 ， 参 见 [Stewart 1999], 

举 一 个 例子 ， 我们 再 次 考虑 图 5-10 中 的 路 由 器 1b。 前 面 讲 过 到 前 级 x 确切 地 有 两 条 
BGP 路 由 ， 一 条 通过 AS2 而 另 一 条 绕 过 AS2。 前 面 也 讲 过 如 果 它 使 用 自己 的 热土 豆 路 由 选 
择 ， 则 BGP 将 通过 AS2 向 前 级 x 路 由 分 组 但 在 上 面 的 路 由 选择 算法 中 ， 在 规则 3 之 前 应 
用 了 规则 2， 导 致 BGP 选择 绕 过 AS2 的 那 条 路 由 ， 因 为 该 路 由 具有 更 短 的 AS-PATH。 因 此 
我 们 看 到 使 用 上 述 路 由 选择 算法 ，BGP 不 再 是 一 种 自私 的 算法 ， 即 它 先 查找 具有 短 AS 路 
径 的 路 由 (因而 很 可 能 减 小 端 到 端 时 延 ) 。 

如 上 所 述 ，BGP 是 因特网 AS 间 路 由 选择 事实 上 的 标准 。 要 查看 从 第 1 层 ISP 中 提取 
的 各 种 BGP 路 由 选择 表 (庞大 !) ， 可 参见 http://www. routeviews. org, BGP 路 由 选择 表 通 
常 包含 超过 50 万 条 路 由 〈 即 前 级 和 相应 的 属性 ) BOP 路 由 选择 表 的 规模 和 特征 的 统计 可 
在 [Potaroo 2016] 中 找到 。 


5.4.4 1IP 任 播 


除了 作为 因特网 的 AS 间 路 由 选择 协议 外 ，BGP 还 常 被 用 于 实现 外 任 播 (anycast) 服务 
[RFC 1546, RFC 7094 ] ， 该 服务 通常 用 于 DNS 中 。 为 了 说 明 IP 任 播 的 动机 ， 考 虑 在 许多 应 
用 中 ,我 们 对 下 列 情况 感 兴趣 : 中 在 许多 分 散 的 不 同 地 理 位 置 ， 蔡 换 不 同 服务 器 上 的 相同 内 
容 ; @ 让 每 个 用 户 从 最 靠近 的 服务 器 访问 内 容 。 例 如 ， 一 个 CDN 能 够 更 换 位 于 不 同 国家 、 
不 同 服务 器 上 的 视频 和 其 他 对 象 。 类 似 地 ，DNS 系统 能 够 在 遍及 全 世界 的 DNS 服务 器 上 复 
ti] DNS 记录 。 当 一 个 用 户 要 访问 该 复制 的 内 容 ， 可 以 将 用 户 指向 具有 该 复制 内 容 的 “最 近 
的 ”服务 器 。BGP 的 路 由 选择 算法 为 做 这 件 事 提供 了 一 种 最 为 容易 和 自然 的 机 制 。 

为 使 我 们 的 讨论 具体 ， 我 们 描述 CDN 可 能 使 用 他 任 播 的 方式 。 如 图 5-12 所 示 , 在 人 * 
任 播 配置 阶段 ，CDN 公司 为 它 的 多 台 服 务 器 指派 相同 的 IP 地 址 ， 并 且 使 用 标准 的 BOP 从 
这 些 服务 器 的 每 台 来 通告 该 卫 地址 。 当 某 台 BGP 路 由 器 收 到 对 于 该 卫 地 址 的 多 个 路 由 通 
告 ， 它 将 这 些 通告 处 理 为 对 相同 的 物理 位 置 提供 不 同 的 路 径 〈 事 实 上 ， 这 时 这 些 通告 对 不 
同 的 物理 位 置 是 有 不 同 路 径 的 ) 。 当 配置 其 路 由 选择 表 时 ， 每 台 路 由 器 将 本 地 化 地 使 用 
BGP 路 由 选择 算法 来 挑选 到 该 IP 地 址 的 “最 好 的 ”( 例 如， 由 AS 跳 计 数 确定 的 最 近 的 ) 
路 由 。 例 如 ， 如 果 一 个 BGP 路 由 (对 应 于 一 个 位 置 ) 离 该 路 由 器 仅 一 AS 跳 的 距离 ， 并 且 
所 有 其 他 BGP 路 由 (对 应 于 其 他 位 置 ) 是 两 AS 跳 和 更 多 AS 跳 ， 则 该 BCP 路 由 器 将 选择 
把 分 组 路 由 到 一 跳远 的 那个 位 置 。 在 这 个 初始 BGP 地 址 通告 阶段 后 ，CDN 能 够 进行 其 分 
发 内 容 的 主要 任务 。 当 某 客户 请 求 视频 时 ，CDN 向 该 客户 返回 由 地 理 上 分 散 的 服务 器 所 使 
用 的 共同 下 地址， 而 无 论 该 客户 位 于 何 处 。 当 该 客户 想 向 那个 IP 地 址 发 送 一 个 请 求 时 ， 
因特网 路 由 器 则 向 那个 “最 近 的 ”服务 器 转发 该 请 求 分 组 ， 最 近 的 服务 器 是 由 BGP 路 由 
选择 算法 所 定义 的 。 

尽管 上 述 CDN 的 例子 很 好 地 诠释 了 能 够 如 何 使 用 下 任 播 ， 但 实践 中 CDN 通常 选择 不 
使 用 也 任 播 ， 因为 BGP 路 由 选择 变化 能 够 导致 相同 的 TCP 连接 的 不 同 分 组 到 达 Web 服务 
器 的 不 同 实 例 。 但 中 任 播 被 DNS 系统 广泛 用 于 将 DNS 请 求 指向 最 近 的 根 DNS 服务 器 。 
2. 4 节 讲 过 ， 当 前 根 DNS 服务 器 有 13 个 IP 地 址 。 但 对 应 于 这 些 地 址 的 每 一 个 ， 有 多 个 
DNS 根 服务 器 ， 其 中 有 些 地 址 具有 100 多 个 DNS 根 服务 器 分 散在 世界 的 各 个 角落 。 当 一 
个 DNS 请 求 向 这 13 个 IP 地 址 发 送 时 ， 使 用 IP 任 播 将 该 请 求 路 由 到 负责 该 地 址 的 最 近 的 
那个 DNS 根 服务 器 。 
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从 AS1 和 AS4 接 收 到 对 于 
212.21.21.21 的 BGP 通告 。 
因为 服务 器 B 更 近 , 故 向 其 
转发 


212.21.21.21 X 
CDN 


服务 器 A ne 


212.21.21.21 Opn 
服务 器 B 
图 5-12 使 用 中 任 播 将 用 户 引 向 最 近 的 CDN 服务 器 


5.4.5 路 由 选择 策略 


当 某 路 由 器 选择 到 目的 地 的 一 条 路 由 时 ，AS 路 由 选择 策略 能 够 胜 过 所 有 其 他 考虑 ， 
例如 最 短 AS 路 径 或 热土 豆 路 由 选择 。 在 路 由 选择 算法 中 ， 实 际 上 首先 根据 本 地 偏好 属性 
选择 路 由 ， 本 地 偏好 值 由 本 地 AS 的 策略 所 确定 。 

我 们 用 一 个 简单 的 例子 说 明 BGP 路 由 选择 策略 的 某 些 基本 概念 。 图 5-13 显示 了 6 个 
互联 的 自治 系统 : A B,C W X 和 图 例 : 
Y。 重 要 的 是 注意 到 A、B、C、W、X 和 | N nN Hotes 
YEAS, 而 不 是 路 由 器 。 假 设 自 治 系统 WHAT | 一 n 
W., XAY EIA ISP, mA, BACE c 
主干 提供 商 网 络 。 我 们 还 要 假设 A、B 
和 C 直接 向 彼此 发 送 流量 ， 并 向 它们 的 图 5-13 一 个 简单 的 BGE PEER 
客户 网 络 提供 全 部 的 BGP 信息 。 所 有 进入 一 个 接 入 ISP 网 络 的 流量 必定 是 以 该 网 络 为 目的 
地 ， 所 有 离开 一 个 接 信 ISP 网 络 的 流量 必定 源 于 该 网 络 。W 和 Y 显然 是 接 入 ISP。X 是 一 
个 多 宿 接 入 ISP (multi-homed stub network) ， 因 为 它 是 经 由 两 个 不 同 的 提供 商 连 到 网 络 的 
其 余部 分 (这 种 方法 在 实践 中 变 得 越 来 越 普遍 )。 然 而 ,就 像 WW 和 YY 一样，X 自身 必定 是 
进入 /离开 X 的 所 有 流量 的 源 / 目 的 地 。 但 这 种 桩 网 络 的 行为 是 如 何 实现 和 强制 实现 的 呢 ? 
X 如 何 防止 转发 B 与 C 之 间 的 流量 呢 ? 这 能 够 通过 控制 BCP 路 由 的 通告 方式 容易 地 实现 。 
特别 是 ，X 如 果 (向 其 邻居 B 和 C) 通告 它 没有 通 向 ( 除 自身 以 外 ) 任何 其 他 目的 地 的 路 
径 ， 那 么 它 将 起 到 一 个 接 入 ISP 的 作用 。 这 就 是 说 ， 即 使 X 可 能 知道 一 条 路 径 ( 比如 说 
XCY) 能 到 达 网 络 Y， 它 也 将 不 把 该 条 路 径 通 告 给 B。 由 于 B 不 知道 X 有 一 条 路 径 到 了 ， 
B 绝 不 会 经 由 X 转发 目的 为 Y (或 C) 的 流量 。 这 个 简单 的 例子 说 明了 如 何 使 用 一 条 选择 
的 路 由 通告 策略 来 实现 客户 /提供 商 路 由 选择 关系 。 

我 们 接 下 来 关注 一 个 提供 商 网 络 ， 比 如 自治 系统 B。 假定 B 已 经 (从 A 处 ) 知道 了 A 
有 一 条 到 W 的 路 径 AW。B 因此 能 将 路 由 AW 安装 到 其 路 由 信息 库 中 。 显 然 ，B 也 想 向 它 
的 客户 X 通告 路 径 BAW， 这 样 X 知道 它 能 够 通过 B 路 由 到 W. 但 是 ，B 应 该 将 路 径 BAW 
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通告 给 C 吗 ? 如 果 它 这 样 做 ， 则 C 可 以 经 由 BAW 将 流量 引导 到 WW。 如果 A、B 和 C 都 是 
主干 提供 商 ， 而 B 也 许 正好 觉得 它 不 应 该 承担 在 A 与 C 之 间 传 送 流量 的 负担 (和 开销 )。 
B 可 能 有 理由 认为 ,确保 C 能 经 过 A AC 之 间 的 直接 连接 引导 A 客户 的 来 去 流量 是 A 和 C 
的 工作 (和 开销 )。 目 前 还 没有 强制 主干 ISP 之 间 如 何 路 由 选择 的 官方 标准 。 然 而 ， 商 业 
运行 的 ISP 们 都 遵从 的 一 个 经 验 法 则 是 : 任何 穿越 某 ISP 主干 网 的 流量 必须 是 其 源 或 目的 
(或 两 者 ) 位 于 该 ISP 的 某 个 客户 网 络 中 ; 不 然 的话 这 些 流量 将 会 免费 搭车 通过 该 ISP 的 
网 络 。 各 个 对 等 协定 (用 于 解决 前 面 提 到 的 问题 ) 通常 都 是 ISP 双方 进行 协商 ， 而 且 经 常 
是 对 外 保密 的 ; [Huston 1999a] 提供 了 关于 对 等 协定 的 有 趣 讨论 。 路 由 选择 策略 如 何 反 映 
ISP 之 间 的 商业 关系 的 详细 描述 参见 [Gao 2001; Dmitiropoulos 2007 ] 。 从 ISP 的 立场 出 发 ， 
有 关 BGP 路 由 选择 策略 的 讨论 参见 [ Caesar 2005b |] 。 

我 们 完成 了 对 BGP 的 简要 介绍 。 理 解 BGP 是 重要 的 ， 因 为 它 在 因特网 中 起 着 重要 作用 。 
我 们 鼓励 你 阅读 参考 文献 [Griffin 2012; Stewart 1999; Labovitz 1997; Halabi 2000; Huitema 
1998; Gao 2001; Feamster 2004; Caesar 2005b; Li 2007] ， 以 学 习 更 多 的 BGP 知识 。 


为 什么 会 有 不 同 的 AS 间 和 AS 内 部 路 由 选择 协议 ? 


学 习 了 目前 部 署 在 因特网 中 的 特定 的 AS 间 和 AS 内 部 路 由 选择 协议 的 细节 后 ， 我 
们 可 通过 思考 对 这 些 协议 首先 会 问 的 也 许 最 为 根本 性 的 问题 来 得 到 结论 (希望 你 已 经 在 
思考 该 问题 ， 并 且 不 致 因 技 术 细 节 而 不 能 把 握 全 局 ) : 为 什么 所 使 用 的 AS 间 和 AS 内 部 
路 由 选择 协议 是 不 同 的 ? 

对 该 问题 的 答案 触及 了 AS 内 与 AS 间 的 路 由 选择 目标 之 间 差 别 的 本 质 : 

e 策略 。 在 AS 之 间 ， 策略 问 题 起 主导 作用 。 一 个 给 定 AS 产生 的 流量 不 能 穿 过 另 

一 个 特定 的 AS， 这 可 能 非常 重要 。 类 似 地 ， 一 个 给 定 AS 也 许 想 很 好 地 控制 它 承 
载 的 其 他 AS 之 间 穿 越 的 流量 。 我 们 已 看 到 ，BGP 承载 了 路 径 必 性， 并 提供 路 由 
选择 信息 的 受 控 分 布 ， 以 便 能 做 出 这 种 基于 策略 的 路 由 选择 决策 。 在 一 个 AS 内 
部 ， 一 切 都 是 在 相同 的 管理 控制 名 义 下 进行 的 ， 因 此 策略 问题 在 AS 内 部 选择 路 
由 中 起 着 微不足道 的 作用 。 
规模 。 扩 展 一 个 路 由 选择 算法 及 其 数据 结构 以 处 理 到 大 量 网 络 或 大 量 网 络 之 间 的 
路 由 选择 的 这 种 能 力 ， 是 AS 间 路 由 选择 的 一 个 关键 问题 。 在 一 个 AS 内 ， 可 扩 
展 性 不 是 关注 的 焦点 。 首 先 ， 如 果 单 个 ISP 变 得 太 大 时 ， 总 是 能 将 其 分 成 两 个 
AS， 并 在 这 两 个 新 的 AS 之 间 执 行 AS 间 路 由 选择 。 (前 面 讲 过 ，OSPF 通过 将 一 
个 AS 分 成 区 域 而 建立 这 样 的 层次 结构 。) 
性 能 。 由 于 AS 间 路 由 选择 是 面向 策略 的 ， 因 此 所 用 路 由 的 质量 (如 性 能 ) 通 
常 是 次 要 关心 的 问题 ( 即 一 条 更 长 或 开销 更 高 但 能 满足 菜 些 策略 条 件 的 路 由 也 
许 被 采用 了 ， 而 更 短 但 不 满足 那些 条 件 的 路 由 却 不 会 被 采用 ) 。 我 们 的 确 看 到 
了 在 AS 之 间 ， 甚 至 没有 与 路 由 相关 的 开销 (除了 AS 跳 计 数 外 ) 概念 。 然 而 
在 一 个 AS 内 部 ， 这 种 对 策略 的 关心 就 不 重要 了 ， 可 以 使 路 由 选择 更 多 地 关注 
一 条 路 由 实现 的 性 能 级 别 。 














264 £5# 








5.4.6 拼装 在 一 起 : 在 因特网 中 呈现 


尽管 本 小 节 不 是 有 关 BOP 本 身 的 ， 但 它 将 我 们 到 此 为 止 看 到 的 许多 协议 和 概念 结合 
到 一 起 ， 包 括 卫 地 址 、DNS 和 BGP, 

假定 你 只 是 创建 了 一 个 具有 若干 服务 器 的 小 型 公司 网 络 ， 包 括 一 台 描 述 公司 产品 和 服 
务 的 公共 Web 服务 器 ， 一 台 从 你 的 雇员 获得 他 们 的 电子 邮件 报 文 的 电子 邮件 服务 器 和 一 
台 DNS 服务 器 。 你 当然 乐意 整个 世界 能 够 访问 你 的 Web 站 点 ， 以 得 知 你 的 现 有 产品 和 服 
务 。 此 外 ， 你 将 乐意 你 的 雇员 能 够 向 遍及 世界 的 潜在 客户 发 送 和 接收 电子 邮件 。 

为 了 满足 这 些 目标 ， 你 首先 需要 获得 因特网 连接 ， 要 做 到 这 一 点 ， 需 要 与 本 地 ISP 签 
订 合 同 并 进行 连接 。 你 的 公司 将 有 一 台 网 关 路 由 器 ， 该 路 由 器 将 与 本 地 ISP 的 一 台 路 由 器 
相连 。 该 连接 可 以 是 一 条 通过 现 有 电话 基础 设施 的 DSL 连接 、 一 条 到 ISP 路 由 器 的 租用 
线 ， 或 者 是 第 1 章 描述 的 许多 其 他 接 人 解决 方案 之 一 。 你 的 本 地 ISP 也 将 为 你 提供 一 个 P 
地 址 范围 ， 例 如 由 256 个 地 址 组 成 的 一 个 /24 地 址 范围 。 一 旦 你 有 了 自己 的 物理 连接 和 IP 
地 址 范围 ， 你 将 在 该 地 址 范围 内 分 配 IP 地 址 : 一 个 给 你 的 Web 服务 器 ， 一 个 给 你 的 电子 
邮件 服务 器 ， 一 个 给 你 的 DNS 服务 器 ， 一 个 给 你 的 网 关 路 由 器 ， 并 将 其 他 IP 地 址 分 配给 
公司 网 络 中 的 其 他 服务 器 和 联网 设备 。 

除了 与 一 个 ISP 签订 合同 外 ， 你 还 需要 与 一 个 因特网 注册 机 构 签 订 合 同 ， 以 便 为 你 的 
公司 获得 一 个 域名 ， 如 在 第 2 章 中 所 描述 的 那样 。 例 如 ， 如 果 你 的 公司 名 称 比如 说 是 Xa- 
nadu Inc. ， 你 自然 希望 获得 域名 xanadu. com。 你 的 公司 还 必须 呈现 在 DNS 系统 中 。 具 体 
而 言 ， 因 为 外 部 世界 将 要 联系 你 的 DNS 服务 器 以 获得 该 服务 器 的 IP 地址， 所 以 你 还 需要 
为 注册 机 构 提供 你 的 DNS 服务 器 的 IP 地 址 。 该 注册 机 构 则 在 . com 顶级 域名 服务 器 中 为 你 
的 DNS 服务 器 设置 一 个 表 项 (域名 和 对 应 的 IP 地 址 ) ， 如 第 2 章 所 述 。 在 这 个 步骤 完成 
后 ,任何 知道 你 的 域名 (例如 xanadu. com) 的 用 户 将 能 够 经 过 DNS 系统 获得 你 DNS 服务 
器 的 了 地 址 。 

为 了 使 人 们 能 够 发 现 你 的 Web 服务 器 的 人 地址， 你 需要 在 你 的 DNS 服务 器 中 包括 一 个 
将 你 的 Web 服务 器 的 主机 名 (例如 www. xanadu. com) 映射 到 它 的 他 地址 的 表 项 。 你 还 要 为 
公司 中 其 他 公共 可 用 的 服务 器 设置 类 似 的 表 项 ， 包 括 你 的 电子 邮件 服务 器 。 如 此 一 来 ， 如 果 
Alice 要 浏览 你 的 Web 服务 器 ，DNS 系统 将 联系 你 的 DNS 服务 器 ， 找 到 你 的 Web 服务 器 的 
IP 地 址 ， 并 将 其 给 Alice。Alice 则 能 与 你 的 Web 服务 器 创建 一 个 直接 的 TCP 连接 。 

然而 ， 人 允许 来 自 世 界 各 地 的 外 部 人 员 访 问 你 的 Web 服务 器 ， 仍 然 还 有 一 个 必要 的 、 
决定 性 的 步 又。 考虑 当 Alice 做 下 列 事情 发 生 的 状况 : Alice 知道 你 的 Web 服务 器 的 人 地 
址 ， 她 向 该 IP 地 址 发 送 一 个 全 数据 报 ( 例 如 一 个 TCP SYN 报 文 段 ) 。 该 数据 报 将 通过 因 
特 网 进行 路 由 ， 经 历 了 在 许多 不 同 的 自治 系统 中 的 一 系列 路 由 器 ， 最 终 到 达 你 的 Web fk 
务 器 。 当 任何 一 个 路 由 器 收 到 该 数据 报时 ， 将 去 它 的 转发 表 中 寻找 一 个 表 项 来 确定 转发 该 
数据 报 的 外 出 端口 。 因 此 ， 每 台 路 由 器 需要 知道 你 公司 的 /24 AA (或 者 某 些 聚合 项 ) 。 
一 台 路 由 器 如 何 知 道 你 公司 的 前 缀 呢 ? 如 我 们 刚才 看 到 的 那样 ， 它 从 BGP 知道 了 该 前 缀 。 
具体 而 言 ， 当 你 的 公司 与 本 地 ISP 签订 合同 并 且 获 得 了 分 配 的 前 级 ( 即 一 个 地 址 范围 )， 
你 的 本 地 ISP 将 使 用 BGP 向 与 之 连接 的 ISP 通告 你 的 前 级 。 这 些 ISP 将 依次 使 用 BGP 来 传 
播 该 通告 。 最 终 ， 所 有 的 因特网 路 由 器 将 得 知 了 你 的 前 级 (或 者 包括 你 的 前 缀 的 某 个 聚合 
项 ) ， 因 而 能 够 将 数据 报 适当 地 转发 到 适当 的 Web 和 电子 邮件 服务 器 。 
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5.5 


SDN 控制 平面 


在 本 节 中 ， 我 们 将 深入 SDN 控制 平面 ， 即 控制 分 组 在 网 络 的 SDN 使 能 设备 中 转发 的 
网 络 范围 逻辑 ， 以 及 这 些 设备 和 它们 的 服务 的 配置 与 管理 。 这 里 的 学 习 建立 在 前 面 4.4 节 
中 一 般 化 SDN 转发 讨论 的 基础 上 ， 因 此 你 在 继续 学 习 前 需要 先 回顾 一 下 那 一 节 ， 以 及 本 
章 的 5.1 节 。 如 同 4. 4 节 中 一 样 ， 我 们 将 再 次 采用 在 SDN 文献 中 所 使 用 的 术语 ， 将 网 络 的 
转发 设备 称 之 为 “分 组 交换 机 ” (或 直接 称 为 交换 机 ， 理 解 时 带 上 “分 组 ”二 字 ) ， 因 为 
能 够 根据 网 络 层 源 / 目 的 地 址 、 链 路 层 源 / 目 的 地 址 以 及 运输 层 、 网 络 层 和 链 路 层 中 分 组 首 
部 字段 做 出 转发 决定 。 

SDN 体系 结构 具有 4 个 关键 特征 [Kreutz 2015 ] ; 


基于 流 的 转发 。SDN 控制 的 交换 机 的 分 组 转发 工作 ， 能 够 基于 运输 层 、 网 络 层 或 链 
路 层 首部 中 任意 数量 的 首部 字段 值 进 行 。 在 4.4 节 中 ， 我们 看 到 了 OpenFlow 1.0 抽 
象 允许 基于 11 个 不 同 的 首部 字段 值 进行 转发 。 这 与 我 们 5.2 ~5. 4 节 中 学 习 的 基于 
路 由 器 转发 的 传统 方法 形成 了 鲜明 的 对 照 ， 传 统 方法 中 卫 数据 报 的 转发 仅 依据 数 
据 报 的 目的 UP 地 址 进行 。 回 顾 图 5S-2， 分 组 转发 规则 被 精确 规定 在 交换 机 的 流 表 
中 ; SDN 控制 平面 的 工作 是 计算 、 管 理 和 安装 所 有 网 络 交换 机 中 的 流 表 项 。 
数据 平面 与 控制 平面 分 离 。 这 种 分 离 明 显 地 显示 在 图 5-2 和 图 5-14 中 。 数 据 平面 由 
网 络 交 换 机 组 成 ， 交 换 机 是 相对 简单 (但 快速 ) 的 设备 ， 该 设备 在 它们 的 流 表 中 
执行 “匹配 加 动作 ”的 规则 。 控 制 平面 由 服务 器 以 及 决定 和 管理 交换 机 流 表 的 软 
件 组 成 。 
网 络 控制 功能 : 位 于 数据 平面 交换 机 外 部 。 考 虑 到 SDN 中 的 “S” 表 示 “ 软 件 ”， 
也 许 SDN 控制 平面 由 软件 实现 并 不 令 人 惊讶 。 然 而 ， 与 传统 的 路 由 器 不 同 ， 这 个 
软件 在 服务 器 上 执行 ， 该 服务 器 与 网 络 交换 机 截然 分 开 且 与 之 远离 。 如 在 图 5-14 
中 所 示 ， 控 制 平面 自身 由 两 个 组 件 组 成 : 一 个 SDN 控制 器 (或 网 络 操作 系统 
[Gude 2008] ) ， 以 及 若干 网 络 控制 
应 用 程序 。 控 制 器 维护 准确 的 网 络 
状态 信息 (例如 ， 远 程 链 路 、 交 换 
机 和 主机 的 状态 ) ;为 运行 在 控制 平 
面 中 的 网 络 控制 应 用 程序 提供 这 些 
信息 ; 提供 方法 ， 这 些 应 用 程序 通 
过 这 些 方法 能 够 监视 、 编 程 和 控制 
下 面 的 网 络 设备 。 尽 管 在 图 5-14 中 
的 控制 器 显示 为 一 台 单一 的 服务 器 ， 
但 实践 中 控制 器 仅 是 逻辑 上 集中 的 ， 
通常 在 几 台 服务 器 上 实现 ， 这 些 服 
务 器 提供 协调 的 、 可 扩展 的 性 能 和 
高 可 用 性 。 
可 编程 的 网 络 。 通 过 运行 在 控制 平 ev 
2 R 、 4 5-14 SD RZA z| : SDN 
pii oe eee rae 机 、SDN 控制 器 和 网 络 控制 应 用 程序 


网 络 控制 应 用 程序 





SDN 控 制 的 交换 机 
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SDN 控制 平面 的 “智力 ”， 使 用 了 由 SDN 控制 器 提供 的 API 来 定义 和 控制 网 络 设备 
中 的 数据 平面 。 例 如 ， 一 个 路 由 选择 网 络 控制 应 用 程序 可 以 决定 源 和 目的 地 之 间 的 
端 到 端 路 径 〈 例 如 ， 通 过 使 用 由 SDN 控制 器 维护 的 节点 状态 和 链 路 状态 信息 ， 执 
行 Dijkstra 算法 ) 。 另 一 个 网 络 应 用 程序 可 以 执行 访问 控制 ， 即 决定 交换 机 阻挡 哪个 
分 组 ， 如 4. 4.3 节 中 的 第 三 个 例子 那样 。 还 有 一 个 应 用 程序 可 以 用 执行 服务 器 负载 
均衡 的 方式 转发 分 组 (4.4.3 节 中 我 们 考虑 的 第 二 个 例子 ) 。 

从 讨论 中 我 们 可 见 ，SDN 表示 了 一 种 意义 重大 的 网 络 功能 的 “分 类 ”， 即 数据 平面 交 
换 机 、SDN 控制 器 和 网 络 控制 应 用 程序 是 分 离 的 实体 ， 该 实体 可 以 由 不 同 的 厂商 和 组 织 
构 所 提供 。 这 与 SDN 之 前 模式 形成 了 鲜明 对 照 ， 在 SDN 之 前 模式 中 ， 交 换 机 /路 由 器 GE 
同 其 戏 入 的 控制 平面 软件 和 协议 实现 ) 是 一 个 整体 ， 它 是 垂直 、 综 合 的 ， 并 且 由 单一 的 厂 
商 所 销售 。 在 SDN 中 的 这 种 网 络 功能 分 类 ， 可 以 与 大 型 计算 机 到 个 人 计算 机 的 早期 演化 
相 比拟 ， 前 者 的 硬件 、 系 统 软件 和 应 用 程序 是 由 单一 厂商 所 提供 的 ， 而 后 者 具有 各 自 的 硬 
件 、 操 作 系统 和 应 用 程序 。 计 算 硬 件 、 系 统 软件 和 应 用 程序 的 分 类 ， 无 疑 已 经 在 所 有 这 三 
个 领域 的 创新 驱动 下 导致 了 丰富 、 开 放 的 生态 系统 。 对 SDN 的 希望 是 ， 它 也 将 导致 如 此 
丰富 的 创新 。 

给 出 了 我 们 对 图 5-14 的 SDN 体系 结构 的 理解 ， 自 然 会 产生 许多 问题 。 流 表 是 如 何 实 
际 计 算 的 ， 以 及 在 哪里 进行 的 ? 响应 SDN 控制 的 设备 产生 的 事件 时 (例如 ， 一 条 附属 链 
路 的 激活 /关闭 ) ， 这 些 流 表 是 如 何 更 新 的 呢 ? 在 协作 的 多 台 交 换 机 中 ， 流 表 项 是 如 何以 一 
种 导致 和 谐 、 一 致 的 网 络 范围 功能 的 方式 进行 协作 的 呢 (例如 ， 用 于 转发 分 组 的 从 源 到 目 
的 地 的 端 到 端 路 径 ， 或 与 分 布 式 防火 墙 协作 )? 提供 这 些 以 及 许多 其 他 能 力 是 SDN 控制 平 
面 的 作用 。 


5.5.1 SDN 控制 平面 : SDN 控制 器 和 SDN 网 络 控制 应 用 程序 


我 们 通过 考虑 控制 平面 必须 提供 的 一 般 能 力 开 始 抽象 地 讨论 SDN 控制 平面 。 如 我 们 
所 见 ， 这 种 抽象 即 “ 基 本 原理 ”方法 将 我 们 引 向 一 个 总 体 的 体系 结构 ， 该 体系 结构 反映 了 
SDN 控制 平面 如 何在 实际 中 实现 。 

如 上 所 述 ，SDN 控制 平面 大 体 划 分 为 两 个 部 分 ， 即 SDN 控制 器 和 SDN 网 络 控制 应 用 
程序 。 我 们 先 来 仔细 考察 控制 器 。 自 从 最 早 的 SDN 控制 器 [ Gude 2008] 开发 以 来 , 已 经 
研制 了 多 种 SDN 控制 器 ， 文 献 [Kreutz 2015] 极其 全 面 地 综述 了 最 新 进展 。 图 5-15 提供 
了 一 个 通用 SDN 控制 器 的 更 为 详尽 的 视图 。 控 制 器 的 功能 可 大 体 组 织 为 3 个 层次 。 我 们 以 
一 种 非典 型 的 自 底 向 上 方式 考虑 这 些 层次 : 

o 通信 层 : SDN 控制 器 和 受 控 网 络 设备 之 间 的 通信 。 显 然 ， 如 果 SDN 控制 器 要 控制 

远程 SDN 使 能 的 交换 机 、 主 机 或 其 他 设备 的 运行 ， 需 要 一 个 协议 来 传送 控制 器 与 
这 些 设 备 之 间 的 信息 。 此 外 ， 设 备 必须 能 够 向 控制 器 传递 本 地 观察 到 的 事件 〈 例 
如 ， 一 个 报 文 指示 一 条 附属 链 路 已 经 激活 或 停止 ， 一 个 设备 刚刚 加 入 了 网 络 ， 或 一 
个 心跳 指示 某 设 备 已 经 启动 和 运行 ) 。 这 些 事件 向 SDN 控制 器 提供 该 网 络 状 态 的 最 
新 视图 。 这 个 协议 构成 了 控制 器 体系 结构 的 最 底层 ， 如 图 5-15 中 所 示 。 控 制 器 和 
受 控 设 备 之 间 的 通信 跨越 了 一 个 接口 ， 它 现在 被 称 为 控制 器 的 “ 南 向 ”接口 。 在 
5.5.2 节 中 ,我 们 将 学 习 OpenFlow， 它 是 一 种 提供 这 种 通信 功能 的 特定 协议 。 
OpenFlow 在 大 多 数 SDN 控制 器 中 得 到 了 实现 (即使 不 是 全 部 )。 
© 网 络 范围 状态 管理 层 。 由 SDN 控制 平面 所 做 出 的 最 终 控制 决定 (例如 配置 所 有 交 
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换 机 的 流 表 以 取得 所 和 希望 的 端 到 端 转 发 ， 实 现 负载 均衡 ， 或 实现 一 种 特定 的 防火 墙 
能 力 ) ， 将 要 求 控 制 器 具有 有 关 网 络 的 主机 、 链 路 、 交 换 机 和 其 他 SDN 控制 设备 的 
最 新 状态 信息 。 交 换 机 的 流 表 包 含 计 数 器 ， 其 值 也 可 以 由 网 络 控制 应 用 程序 很 好 地 
使 用 ; 因此 这 些 值 应 当 为 应 用 程序 所 用 。 既 然 控制 平面 的 终极 目标 是 决定 用 于 各 种 
受 控 设 备 的 流 表 ， 控 制 器 也 就 可 以 维护 这 些 表 的 拷贝 。 这 些 信息 都 构成 了 由 SDN 
控制 器 维护 的 网 络 范围 “状态 ”的 例子 。 

e 对 于 网 络 控制 应 用 程序 层 的 接口 。 控 制 器 通过 它 的 “北向 ”接口 与 网 络 控制 应 

程序 交互 。 该 API 允许 网 络 控制 应 at 
当 状 态 改变 事件 出 现时 ， 应 用 程序 能 够 注册 进行 通告 。 可 以 提供 不 同类 型 的 API， 
我 们 将 看 到 两 种 流行 SDN 控制 器 使 用 REST [ Fielding 2000] 请 求 响应 接口 与 它们 
的 应 用 程序 进行 通信 。 

我 们 已 经 提 到 过 几 次 ，SDN 控制 器 被 认为 是 “逻辑 上 集中 ”的 ,， 即 该 控制 器 可 以 被 
外 部 视 为 一 个 单一 、 整 体 的 服务 (例如 ， 从 SDN 控制 设备 和 外 部 的 网 络 控制 应 用 程序 的 
角度 看 )。 然 而 ， 出 于 故障 容忍 、 高 可 用 性 或 性 能 等 方面 的 考虑 ， 在 实践 中 这 些 服务 和 用 
EH etl a 一 般 通过 分 布 式 服务 器 集合 实现 。 在 服务 器 集合 实现 控制 器 功能 

， 必 须 考 虑 控制 器 的 内 部 操作 (例如 维护 事件 的 逻辑 时 间 顺 序 、 一 致 性 、 意 见 一 致 等 ) 
[ Panda 2013 ] 。 这 些 关注 点 在 许 
多 不 同 的 分 布 式 系统 中 都 是 共同 的 ， 这 -| 
些 挑战 的 简洁 解决 方案 可 参见 [ Lamport 
1989; Lampson 1996 ]。 诸 如 OpenDay- 
light 和 ONOS 这 样 的 现代 控制 器 已 经 将 
很 大 的 注意 力 放 在 构建 一 种 逻辑 上 集中 
但 物理 上 分 布 的 控制 器 平台 上 ， 该 平台 
提供 可 扩展 的 服务 和 对 受 控 设 备 以 及 网 
络 控制 应 用 程序 的 高 可 用 性 。 

在 图 5-15 中 描述 的 体系 结构 与 2008 
年 最 初 提出 的 NOX 控制 器 [Gude 2008 ] 
以 及 今天 的 OpenDaylight [ OpenDaylight 
Lithium 2016] 和 ONOS [ ONOS 2016] 
SDN 控制 器 (参见 插入 材料 ) 的 体系 结 
构 极 为 相似 。 我 们 将 在 5.5.3 节 介 绍 一 
个 控制 器 操作 的 例子 。 然 而 ， 我 们 先 来 
仔细 审视 OpenFlow 协议 ， 该 协议 位 于 控 eee 
制 器 的 通信 层 中 。 图 5-15 SDN 控制 器 的 组 件 
5.5.2 OpenFlow 协议 





OpenFlow 协议 | OpenFlow 2009; ONF 2016] 运行 在 SDN 控制 器 和 SDN 控制 的 交换 
机 或 其 他 实现 OpenFlow API 的 设备 之 间 (OpenFlow API 我 们 在 4. 4 节 学 习 过 ) OpenFlow 
协议 运行 在 TCP ŻE, (EH 6653 的 默认 端口 号 。 从 控制 器 到 受 控 交换 机 流动 的 重要 报 文 
有 下 列 这 些 : 
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© 配置 。 该 报 文 允许 控制 器 查询 并 设置 交换 机 的 配置 参数 。 

© 修改 状态 。 该 报 文 由 控制 器 所 使 用 ， 以 增加 /删除 或 修改 交换 机 流 表 中 的 表 项 ， 并 
且 设置 交换 机 端口 特性 。 

© 读 状 态 。 该 报 文 被 控制 器 用 于 从 交换 机 的 流 表 和 端口 收集 统计 数据 和 计数 器 值 。 

© 发 送 分 组 。 该 报 文 被 控制 器 用 于 在 受 控 交 换 机 从 特定 的 端口 发 送出 一 个 特定 的 
报 文 。 

从 受 控 交 换 机 到 控制 器 流动 的 重要 报 文 有 下 列 这 些 : 

e 流 删 除 。 该 报 文通 知 控制 器 已 删除 一 个 流 表 项 ， 例 如 由 于 超时 ， 或 作为 收 到 “修改 
状态 ” 报 文 的 结果 。 

© 端口 状态 。 交 换 机 用 该 报 文 向 控制 器 通知 端口 状态 的 变化 。 

e 分 组 入 。4.4 节 讲 过 ， 一 个 分 组 到 达 交 换 机 端口 ， 并 且 不 能 与 任何 流 表 项 匹配 ， 那 
么 这 个 分 组 将 被 发 送 给 控制 器 进行 额外 处 理 。 匹 配 的 分 组 也 被 发 送 给 控制 器 ， 作 为 
匹配 时 所 采取 的 一 个 动作 。“ 分 组 入 ” 报 文 被 用 于 将 分 组 发 送 给 控制 器 。 另 外 的 
OpenFlow 报 文 定义 在 [OpenFlow 2009; ONF 2016] 中 。 





谷歌 的 软件 定义 全 球 网 络 | 


2.6 节 中 的 学 习 案 例 中 讲 过 ,谷歌 部 署 了 专用 的 广域网 (WAN)， 该 网 互联 了 它 
(在 IXP 和 ISP 中) 的 数据 中 心 和 服务 器 集群 。 这 个 称 为 B4 的 网 络 有 一 个 谷歌 基于 
OpenFlow 设计 的 SDN 控制 平面 。 谷 歌 网 络 能 够 在 长 途 线 路 上 以 接近 70% 的 利用 率 运 
行 WAN 链 路 (超过 典型 的 链 路 利用 率 的 2~3 倍 )， 并且 基 于 应 用 优先 权 和 现 有 的 流 | 
需求 在 多 条 路 径 之 间 分 割 应 用 流 [Jain 2013 ] 。 特 别 是 ， 谷 歌 B4 网 络 适 合 于 SDN: | 
QDAAIXP 和 ISP 中 的 边缘 服务 器 到 网 络 核心 中 的 路 由 器 ， 人 谷歌 控制 了 所 有 的 设备 ; 
@@ 带 宽 最 密集 的 应 用 是 场 点 之 间 的 大 规模 数据 找 贝 ， 这 种 数据 拷贝 在 资源 拥塞 期 间 能 
够 “服从 ” 较 高 优先 权 的 交互 应 用 ; @@ 由 于 仅 连 接 了 几 十 个 数据 中 心 ， 集 中 式 控 制 是 
可 行 的 。 

谷歌 的 B4 网 络 使 用 定制 的 交换 机 ， 每 台 交 换 机 实现 了 OpenFlow 稍 加 扩充 的 版 本 ， 
具有 一 个 本 地 OpenFlow 代理 (OFA) ， 该 OFA 方法 上 类 似 于 我 们 在 图 5-2 中 遇 到 的 控制 
代理 。 每 个 OFA 又 与 网 络 控制 服务 器 (NCS) 中 的 OpenFlow 控制 器 (OFC) 相连 ,使 
用 一 个 分 离 的 “ 带 外 ”网 络 ， 与 在 数据 中 心 之 间 承 载 数据 中 心 流量 的 网 络 截 然 不 同 。 该 
OFC 因此 提供 由 NCS 使 用 的 服务 以 与 它 的 受 控 交换 机 通信 ， 方 法 上 类 似 于 显示 在 图 5- 
15 中 的 SDN 体系 结构 的 最 低层 。 在 B4 中 ，OFC 也 执行 状态 管理 功能 ， 在 网 络 信息 库 
(NIB) 中 保持 节点 和 链 路 状态 。OFC 的 谷歌 实现 基于 ONIX SDN 控制 器 [Koponen 
2010]。 实 现 了 两 种 路 由 选择 协议 ; 用 于 数据 中 心 之 间 路 由 选择 的 BGP 和 用 于 数据 中 心 
内 部 路 由 选择 的 IS-IS (非常 接近 OSPF), Paxos [ Chandra 2007] 用 于 执行 NCS 组 件 的 
热 复制 ， 以 防止 故障 。 

一 种 还 辑 上 置 于 网 络 控 制服 务 器 集合 之 上 的 流量 工程 网 络 控 制 应 用 ， 与 这 些 服务 器 
交互 ， 以 为 一 组 应 用 流 提 供 全 局 、 网 络 范围 的 带宽 。 借 助 于 B4，SDN 一 举 跨 入 全 球 网 
络 提供 商 的 运行 网 络 的 行列 。B4 的 详细 描述 请 参见 [Jain 2013 ] 。 | 
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5.5.3 数据 平面 和 控制 平面 交互 的 例子 


为 了 具体 地 理解 SDN 控制 的 交换 机 与 SDN 控制 器 之 间 的 交互 ， 我 们 考虑 图 5-16 中 所 
示 的 例子 ， 其 中 使 用 了 Dijkstra 算法 (该 算法 我 们 已 在 5.2 节 中 学 习 过 ) 来 决定 最 短路 径 
路 由 。 图 5-16 中 的 SDN 场景 与 前 面 5. 2. 1 节 和 5.3 节 中 描述 的 每 路 由 器 控制 场景 有 两 个 
重要 差异 ，Dijkstra 算法 是 实现 在 每 台 
路 由 器 中 并 且 在 所 有 网 络 路 由 器 中 洪 泛 
链 路 状态 更 新 : 
© Dijkstra 算法 作为 一 个 单独 的 程 
序 来 执行 ， 位 于 分 组 交换 机 的 
外 部 。 

。 分 组 交换 机 向 SDN 控制 器 发 送 
链 路 更 新 并 且 不 互相 发 送 。 

在 这 个 例子 中 ， 我 们 假设 交换 机 
sl 和 s2 之 间 的 链 路 断 开 ; 实现 了 最 短 
路 径路 由 选择 ， 因 此 ， 除 了 s2 操作 未 
改变 外 ，s1、s3 和 s4 的 人 和 出 流转 发 
规则 都 受到 影响 。 我 们 也 假定 Open- 
Flow 被 用 作 通 信 层 协议 ， 控 制 平面 只 
执行 链 路 状态 路 由 选择 而 不 执行 其 他 
功能 。 

1) 交换 机 sl 经 历 了 自己 与 s2 之 间 
的 链 路 故障 ， 使 用 OpenFlow “端口 状 
态 ” 报 文 向 SDN 控制 器 通报 该 链 路 状 
态 的 更 新 。 

2) SDN 控制 器 接收 指示 链 路 状态 
更 新 的 OpenFlow 报 文 ， 并 且 通 告 链 路 状态 管理 器 ， 由 管理 器 更 新 链 路 状态 库 。 

3) 实现 Dijkstra 链 路 状态 路 由 选择 的 网 络 控制 应 用 程序 先前 进行 了 注册 ， 当 链 路 状态 
更 新 时 将 得 到 通告 。 应 用 程序 接收 该 链 路 状态 更 新 的 通告 。 

4) 链 路 状态 路 由 选择 应 用 程序 与 链 路 状态 管理 器 相互 作用 ， 以 得 到 更 新 的 链 路 状态 ; 
它 也 会 参考 状态 管理 层 中 的 其 他 组 件 。 然 后 它 计算 新 的 最 低 开 销路 径 。 

5) 链 路 状态 路 由 选择 应 用 则 与 流 表 管理 器 交互 ， 流 表 管理 器 决定 更 新 的 流 表 。 

6) 流 表 管 理 器 则 使 用 OpenFlow 协议 更 新 位 于 受 影响 的 交换 机 sl, 、s2 和 s4 的 流 表 项 ， 
其 中 sl 此 时 将 经 s4 将 分 组 的 目的 地 指向 s2, s2 此 时 将 经 中 间 交 换 机 中 开始 接收 来 自 sl 
的 分 组 ，s4 此 时 必须 转发 来 自 sl 且 目 的 地 为 s2 的 分 组 。 

这 个 例子 虽 简 单 ， 但 图 示 了 SDN 控制 平面 如 何 提供 控制 平面 服务 (此 时 为 网 络 层 路 
由 选择 ) ， 而 该 服务 以 前 是 以 每 路 由 器 控制 在 每 台 路 由 器 中 实现 的 。 我 们 现在 能 够 容易 地 
体会 到 ，SDN 使 能 的 ISP 能 够 容易 地 将 最 低 开 销路 径 的 路 由 选择 转变 为 更 加 定制 的 路 由 选 
择 方法 。 因 为 控制 器 的 确 能 够 随心 所 欲 地 定制 流 表 ， 因 此 能 够 实现 它 喜欢 的 任何 形式 的 转 
发 ， 即 只 是 通过 改变 它 的 应 用 控制 软件 。 这 种 改变 的 便利 性 与 传统 的 每 路 由 器 控制 平面 的 
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情况 形成 对 照 ， 传 统 的 情况 必须 要 改变 所 有 路 由 器 中 的 软件 ， 而 这 些 路 由 器 可 能 是 由 多 个 
不 同 厂商 提供 给 ISP 的 。 


5.5.4 SDN 的 过 去 与 未 来 


尽管 对 SDN 的 强烈 兴趣 是 相对 近期 的 现象 ,但 SDN 的 技术 根源 ， 特 别 是 数据 平面 和 
控制 平面 的 分 离 ， 可 追溯 到 相当 久远。 在 2004 年 ， 文 献 [ Feamster 2004; Lakshman 2004; 
RFC 3746] 中 都 赞成 网 络 数据 平面 与 控制 平面 分 离 。[ van der Merwe 1998] 描述 了 用 于 具 
有 多 个 控制 器 的 ATM 网 络 [Black 1995] 的 控制 框架 ， 每 台 控 制 器 控制 若干 ATM 交换 机 。 
Ethane 项 目 开拓 了 简单 基于 流 的 多 台 以 太 网 交换 机 和 一 台 集 中 式 控 制 器 的 网 络 概念 ， 其 中 
以 太 网 交换 机 具有 匹配 加 动作 流 表 ， 控 制 器 管理 流 准 入 和 路 由 选择 ， 而 未 匹配 的 分 组 将 从 
交换 机 转发 到 控制 器 。 在 2007 年 ， 超 过 300 台 Ethane 交换 机 的 网 络 投 入 运行 。Ethane if 
速 演化 为 OpenFlow 项 目 ， 而 其 他 的 成 为 历史 ! 

很 多 研究 工作 以 研发 未 来 SDN 体系 结构 和 能 力 为 目标 。 如 我 们 所 见 ，SDN 革命 正在 
导致 颠覆 性 地 替代 专用 的 整体 交换 机 和 路 由 器 (它们 同时 具有 数据 平面 和 控制 平面 )。 类 
似 地 ， 称 之 为 网 络 功能 虚拟 化 (NFV) 的 通用 SDN 的 目标 是 用 简单 的 商用 服务 器 、 交 换 
机 和 存储 器 [Gember-Jacobson 2014] 来 颠覆 性 地 替代 复杂 的 中 间 盒 〈 例 如 用 于 媒体 高 速 
缓存 /服务 的 具有 专用 硬件 和 专 有 软件 的 中 间 盒 ) 。 第 二 个 重要 研究 领域 是 寻求 将 SDN 概 
OM AS 内 部 设置 扩展 到 AS 之 间 设 置 [Gupta 2014], 


SDN 控制 器 学 习 案例 : OpenDaylight 和 ONOS 控制 器 


Æ SDN 发 展 早期 ， 采 用 单一 的 SDN 协议 (OpenFlow [ McKeown 2008; OpenFlow 
2009]) 和 单一 的 SDN 控制 器 (NOX [Gude 2008] )。 此 后 ， 尤 其 是 SDN 控制 器 的 数量 有 
了 很 大 增长 【Kreutz 2015]。 某 些 SDN 控制 器 是 公司 特有 的 和 专用 的 ， 例 如 ONIX [Kopo- 
nen 2010], 14} 44-45 Contrail [Juniper Contrail 2016] 以 及 谷歌 用 于 其 B4 广域网 的 控制 
& [Jain 2013 ] 。 而 更 多 控制 器 是 开源 的 并 以 各 种 各 样 的 编程 语言 实现 Erickson 2013 ] 。 
最 近 ，OpenDaylight 控制 器 [OpenDaylight Lithium 2016] 和 ONOS 控制 器 [ONOS 2016] 
在 产业 界 得 到 广泛 支持 。 它 们 都 是 开源 的 ， 并 且 是 与 Linux 基金 会 合作 开发 的 。 

OpenDaylight 控制 器 

图 5-17 呈现 了 OpenDaylight Lithium SDN 控制 器 平台 的 简化 视图 [ OpenDaylight 
Lithium 2016] 。ODL 控制 器 组 件 的 主要 部 分 与 我 们 在 图 5-15 中 给 出 的 那些 组 件 严格 
对 应 。 网 络 服务 应 用 程序 用 于 决定 数据 平面 转发 和 其 他 服务 (如 防火 墙 和 负载 均衡 ) 
如 何在 受 控 交换 机 中 完成 。 与 图 5$-15 中 规范 的 控制 器 不 同 ，ODL 控制 器 具有 两 个 接 
口 ， 通 过 这 两 个 接口 ， 应 用 程序 可 以 与 原生 的 控制 器 服务 通信 以 及 彼此 之 间 相 互通 
信 : 外 部 应 用 程序 使 用 REST 请 求 -响应 API 与 控制 器 模块 通信 ， 通 信 运 行 在 HTTP 
上 。 内 部 应 用 程序 经 过 服务 抽象 层 (SAL) 互相 通信 。 至 于 控制 器 应 用 程序 是 在 外 部 
还 是 内 部 实现 ， 这 是 由 应 用 程序 设计 者 选择 决定 的 ， 图 5-17 中 显示 的 特定 应 用 程序 
配置 只 是 作为 一 个 例子 。 











AZE: ERPE 271 

























$a i 管理 程序 || 管理 程序 |] 管理 程序 || ODL 控 制 器 
管理 程序 | 管理 程序 


图 5-17 ri 控制 器 


ODL 的 基本 网 络 服务 功能 是 该 控制 器 的 核心 ， 它 们 密切 对 应 于 我 们 在 图 $-15 Ph 
到 的 网 络 范围 状态 管理 能 力 。SAL 是 控制 器 的 神经 中 枢 ， 允 许 控 制 器 组 件 和 应 用 程序 互 
相 调 用 服务 并 且 订 阅 它们 产生 的 事件 。 它 也 在 通信 层次 对 特定 的 底层 通信 协议 提供 了 统 
一 的 抽象 接口 ， 包 括 OpenFlow fe SNMP (简单 网 络 管理 协议 ， 即 我 们 将 在 5.7 节 中 涉及 
的 一 种 网 络 管理 协议 ) OVSDB 是 用 于 管理 数据 中 心 交换 的 协议 ,而 数据 中 心 交换 是 
SDN 技术 的 一 个 重要 应 用 领域 。 我 们 将 在 第 6 章 中 介绍 数据 中 心 网 络 。 


网 络 控制 应 用 程序 








北向 抽象 ， 协 议 REST AP 


过 


ei M OpenFlow [| Netconf | 


图 5-18 ONOS 控制 器 体系 结构 
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ONOS 控制 器 
图 5-18 呈现 了 ONOS 控制 器 的 简化 视图 [ONOS 2016]。 类 似 于 图 5-15 中 的 规范 控 | 
制 器 ， 在 ONOS 控制 器 中 有 三 个 层次 ; 

e 北向 抽象 和 协议 。ONOS 的 一 个 独 有 特征 是 它 的 意图 框架 ， 它 允许 应 用 程序 请 求 
高 层 服 务 (例如 ， 在 主机 A 和 主机 B 之 间 建 立 一 条 连接 ， 或 相反 地 不 允许 主机 | 
A 和 主机 B 通信 )， 而 不 必 知道 该 服务 的 执行 细节 。 或 者 以 同步 的 方式 (经 过 请 
求 ) ， 或 者 以 异步 的 方式 (经 过 监听 程序 回调 ， 例 如 等 网 络 状态 改变 时 ) ， 经 过 
北向 API 向 网 络 控 制 的 应 用 程序 提供 状态 信息 。 | 

e 分 布 式 核 。ONOS 的 分 布 式 核 中 维护 了 网 络 的 链 路 、 主 机 和 设备 的 状态 。ONOS 
被 部 署 为 在 一 系列 互联 的 服务 器 上 的 一 种 服务 ， 每 台 服 务 器 运行 着 ONOS 软件 的 | 
相同 副本 ， 增 加 服务 器 数量 就 提升 了 服务 能 力 。ONOS 核 提供 了 在 实例 之 间 服 务 | 
复制 和 协同 的 机 制 ， 这 种 机 制 为 上 层 应 用 程序 和 下 层 网 络 设备 提供 了 远 辑 上 集中 | 
的 核 服务 抽象 。 | 

。 南 向 抽象 和 协议 。 南 向 抽象 屏蔽 了 底层 主机 、 链 路 、 交 换 机 和 协议 的 异 构 性 ， 网 
许 分 布 式 核对 设备 和 协议 不 可 知 。 因 为 这 种 抽象 ， 位 于 分 布 式 核 下 方 的 南 向 接口 
逻辑 上 比 图 5-14 中 的 规范 控制 器 或 图 5-17 中 的 ODL 控制 器 更 高 。 











5.6 ICMP: 因特网 控制 报 文 协 议 


由 [RFC 792] 定义 的 因特网 控制 报 文 协议 (ICMP)， 被 主机 和 路 由 器 用 来 彼此 沟通 
网 络 层 的 信息 。ICMP 最 典型 的 用 途 是 差错 报告 。 例 如 ， 当 运行 一 个 HTTP 会 话 时 ， 你 也 
许 会 遇 到 一 些 诸如 “目的 网 络 不 可 达 ” 之 类 的 错误 报 文 。 这 种 报 文 就 来 源 于 ICMP。 在 某 
个 位 置 ， 人 P 路 由 器 不 能 找到 一 条 通 往 HTTP 请 求 中 所 指定 的 主机 的 路 径 ， 该 路 由 器 就 会 向 
你 的 主机 生成 并 发 出 一 个 ICMP 报 文 以 指示 该 错误 。 

ICMP 通常 被 认为 是 IP 的 一 部 分 , 但 从 体系 结构 上 讲 它 位 于 IP 之 上 ， 因 为 ICMP 报 文 
是 承载 在 IP 分 组 中 的 。 这 就 是 说 ，ICMP 报 文 是 作为 卫 有 效 载荷 承载 的 ， 就 像 TCP 与 
UDP 报 文 段 作为 P 有 效 载荷 被 承载 那样 。 类 伏地 ， 当 一 台 主 机 收 到 一 个 指明 上 层 协 议 为 
ICMP 的 中 数据 报时 (上层 协议 编码 为 1) ， 它 分 解 出 该 数据 报 的 内 容 给 ICMP， 就 像 分 解 
出 一 个 数据 报 的 内 容 给 TCP 或 UDP 一 样 。 

ICMP 报 文 有 一 个 类 型 字段 和 一 个 编码 字段 ， 并 且 包 含 引 起 该 ICMP 报 文 首 次 生成 的 
IP 数据 报 的 首部 和 前 8 个 字 节 (以 便 发 送 方 能 确定 引发 该 差错 的 数据 报 ) 。 在 图 5-19 中 显 
示 了 所 选 的 ICMP 报 文 类 型 。 注 意 到 ICMP 报 文 并 不 仅 是 用 于 通知 差错 情况 。 

众所周知 的 ping 程序 发 送 一 个 ICMP 类 型 8 编码 0 的 报 文 到 指定 主机 。 看 到 回 显 
(echo) 请 求 ， 目 的 主机 发 回 一 个 类 型 0 编码 0 的 ICMP 回 显 回答 。 大 多 数 TCP/IP 实现 直 
接 在 操作 系统 中 支持 ping 服务 器 ， 即 该 服务 器 不 是 一 个 进程 。[ Stevens 1990] 的 第 11 章 
提供 了 有 关 ping 客户 程序 的 源码 。 注 意 到 客户 程序 需要 能 够 指示 操作 系统 产生 一 个 类 型 8 
编码 0 的 ICMP 报 文 。 

为 一 个 有 趣 的 ICMP 报 文 是 源 抑制 报 文 。 这 种 报 文 在 实践 中 很 少 使 用 。 其 最 初 目 的 是 
执行 拥塞 控制 ， 即 使 得 拥塞 的 路 由 器 向 一 台 主 机 发 送 一 个 ICMP 源 抑制 报 文 ， 以 强制 该 主 
机 减 小 其 发 送 速率 。 我 们 在 第 3 章 已 看 到 ，TCP 在 运输 层 有 自己 的 拥塞 控制 机 制 ， 不 需要 
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利用 网 络 层 中 的 反馈 信息 ， 如 ICMP 源 抑 制 报 文 。 
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回 显 回答 (对 ping 的 回答 ) 
目的 网 络 不 可 达 
目的 主机 不 可 达 
目的 协议 不 可 达 
目的 端口 不 可 达 
目的 网 络 未 知 


IP 首部 损坏 
图 5$-19 ICMP 报 文 类 型 
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在 第 1 章 中 我 们 介绍 了 Traceroute 程序 ， 该 程序 允许 我 们 跟踪 从 一 台 主 机 到 世界 上 
任意 一 台 主 机 之 间 的 路 由 。 有 趣 的 是 ，Traceroute 是 用 ICMP 报 文 来 实现 的 。 为 了 判断 源 
和 目的 地 之 间 所 有 路 由 器 的 名 字 和 地 址 ， 源 主机 中 的 Traceroute 向 目的 地 主机 发 送 一 系 
列 普通 的 IP 数据 报 。 这 些 数据 报 的 每 个 携带 了 一 个 具有 不 可 达 UDP 端口 号 的 UDP 报 文 
段 。 第 一 个 数据 报 的 TTL 为 1， 第 二 个 的 TTL 为 2， 第 三 个 的 TIL 为 3， 依 次 类 推 。 该 
源 主机 也 为 每 个 数据 报 启动 定时 器 。 当 第 n 个 数据 报到 达 第 n 台 路 由 器 时 ,第 n 台 路 由 
器 观察 到 这 个 数据 报 的 TTL 正好 过 期 。 根 据 IP pi ， 路 由 器 丢弃 该 数据 报 并 发 送 

一 个 ICMP 告警 报 文 给 源 主机 (类 型 11 编码 0) 。 该 告警 报 文 包含 了 路 由 器 的 名 字 和 它 
的 卫 地 址 。 当 该 ICMP 报 文 返回 源 主机 时 ， 源 主机 从 定时 器 得 到 往返 时 延 J ICMP 报 
文中 得 到 第 n 人 台 路 由 器 的 名 字 与 他 地址 。 

Traceroute 源 主机 是 怎样 知道 何 时 停止 发 送 UDP 报 文 段 的 呢 ? 前 面 讲 过 源 主机 为 它 发 
送 的 每 个 报 文 段 的 TIL 字段 加 1。 因 此， 这 些 数据 报 之 一 将 最 终 沿 着 这 条 路 到 达 目 的 主 
机 。 因 为 该 数据 报 包含 了 一 个 具有 不 可 达 端 口号 的 UDP 报 文 段 ， 该 目的 主机 将 向 源 发 送 
一 个 端口 不 可 达 的 ICMP 报 文 (类 型 3 编码 3)。 当 源 主机 收 到 这 个 特别 的 ICMP 报 文 时 ， 
知道 它 不 需要 再 发 送 另 外 的 探测 分 组 。( 标 准 的 Traceroute 程序 实际 上 用 相同 的 TTL 发 送 3 
个 一 组 的 分 组 ， 因 此 Traceroute 输出 对 每 个 TTL 提供 了 3 个 结果 。) 

以 这 种 方式 ， 源 主机 知道 了 位 于 它 与 目的 主机 之 间 的 路 由 器 数量 和 标识 ， 以 及 两 台 主 
机 之 间 的 往返 时 延 。 注 意 到 Traceroute 客户 程序 必须 能 够 指令 操作 系统 产生 具有 特定 TTL 
值 的 UDP 数据 报 ， 当 ICMP 报 文 到 达 时 ， 也 必须 能 够 由 它 的 操作 系统 进行 通知 。 既 然 你 已 
明白 了 Traceroute 的 工作 原理 ， 你 也 许 想 返回 去 更 多 地 使 用 它 。 

在 RFC 4443 中 为 IPv6 定义 了 ICMP 的 新 版 本 。 除 了 重新 组 织 现 有 的 ICMP 类 型 和 编码 
定义 外 ，ICMPv6 还 增加 了 新 型 IPv6 功能 所 需 的 新 类 型 和 编码 。 这 些 包 括 “ 分 组 太 大 ”类 
型 和 一 个 “未 被 承认 的 IPv6 选项 ”差错 编码 。 
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5.7 网 络 管理 和 SNMP 


此 时 我 们 的 网 络 层 学 习 已 经 走 到 了 结尾 ， 我 们 前 面 仅 有 链 路 层 了 ， 我 们 都 熟知 网 络 是 由 
许多 复杂 、 交 互 的 硬件 和 软件 部 件 组 成 的 ， 既 包括 构成 网 络 的 物理 部 件 的 链 路 、 交 换 机 、 路 
由 器 、 主 机 和 其 他 设备 ， 也 包括 控制 和 协调 这 些 设备 的 许多 协议 。 当 一 个 机 构 将 数 以 百 计 或 
数 以 千 计 的 这 种 部 件 拼装 在 一 起 形成 一 个 网 络 时 ， 保 持 该 网 络 “运行 良好 ”对 网 络 管理 员 无 
疑 是 一 种 挑战 。 我 们 在 5. 5 节 中 看 到 ，SDN 环境 中 逻辑 上 集中 的 控制 器 能 够 有 助 于 这 种 过 
程 。 但 是 网 络 管理 的 挑战 在 SDN 出 现 前 很 久 就 已 如 影 相 随 了 ， 网 络 管理 员 使 用 丰富 的 网 络 管 
理工 具 和 方法 来 监视 、 管 理 和 控制 该 网 络 。 在 本 节 中 我 们 将 学 习 这 些 工 具 和 技术 。 

一 个 经 常 被 问 到 的 问题 是 : 什么 是 网 络 管理 ? 我 们 用 一 个 构思 续 密 的 单 句 (虽然 它 相 
HERK) 来 概括 网 络 管理 的 定义 [Saydam 1996] ; 

“网 络 管理 包括 了 硬件 、 软 件 和 人 类 元 素 的 设置 、 综 合 和 协调 ， 以 监视 、 测 

试 、 轮 询 、 配 置 、 分 析 、 评 价 和 控制 网 络 及 网 元 资源 ， 用 合理 的 成 本 满足 实时 

性 、 运 营 性 能 和 服务 质量 的 要 求 。” 

给 定 了 这 个 宽泛 的 定义 ， 本 节 我 们 将 仅 涉及 网 络 管理 的 入 门 知 识 ， 即 网 络 管理 员 在 执 
行 其 任务 中 所 使 用 的 体系 结构 、 协 议和 信息 库 。 我 们 将 不 涉及 网 络 管理 员 的 决策 过 程 ， 其 
中 故障 标识 [ Labovitz 1997; Steinder 2002; Feamster 2005; Wu 2005; Teixeira 2006], 
常 检测 [Lakhina 2005; Barford 2009 ] 、 满 足 约定 的 服务 等 级 约定 (Service Level Agree- 
ments，SLA) 的 网 络 设计 /工程 [Huston 1999a] 等 主题 会 加 以 考虑 。 因 此 我 们 有 意识 地 
收 罕 关 注 点 ， 有 兴趣 的 读者 应 当 参 考 这 些 文献 : 由 Subramanian 撰写 的 优秀 的 网 络 管理 教 
PHE [Subramanian 2000] ， 以 及 本 书 Web 网 站 上 可 用 的 详尽 的 网 络 管理 材料 。 


5.7.1 网 络 管理 框架 
图 5-20 显 式 了 网 络 管理 的 关键 组 件 。 





图 例 : 
+ > SNMP 协 议 
图 5-20 网络 管理 的 组 件 : 管理 服务 器 ， 被 管 设备 ，MIB 数据 ， 远 程 代理 ，SNMP 
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。 管理 服务 器 (managing server) 是 一 个 应 用 程序 ， 通 常 有 人 的 参与 ， 并 运行 在 网 络 
运营 中 心 (NOC) 的 集中 式 网 络 管理 工作 站 上 。 管 理 服务 器 是 执行 网 络 管理 活动 的 
地 方 ， 它 控制 网 络 管理 信息 的 收集 、 处 理 、 分 析 和 /或 显示 。 正 是 在 这 里 ， 发 起 控 
制 网 络 行为 的 动作 ， 人 类 网 络 管理 员 与 网 络 设备 打交道 。 

被 管 设备 (managed device) 是 网 络 装备 的 一 部 分 〈 包 括 它 的 软件 ) ， 位 于 被 管理 的 
网 络 中 。 被 管 设备 可 以 是 一 台 主 机 、 路 由 器 、 交 换 机 、 中 间 盒 、 调 制 解 调 器 、 温 度 
计 或 其 他 联网 的 设备 。 在 一 个 被 管 设 备 中 ， 有 几 个 所 谓 被 管 对 象 (managed ob- 
ject) 。 这 些 被 管 对 象 是 被 管 设备 中 硬件 的 实际 部 分 (例如 ， 一块 网 络 接口 卡 只 是 一 
台 主 机 或 路 由 器 的 一 个 组 件 ) 和 用 于 这 些 硬件 及 软件 组 件 的 配置 参数 〈 例 如 ， 像 
OSPF 这 样 的 AS 内 部 路 由 选择 协议 ) 。 

一 个 被 管 设 备 中 的 每 个 被 管 对 象 的 关联 信息 收集 在 管理 信息 库 (Management Infor- 
mation Base, MIB) 中 ,我 们 将 看 到 这 些 信息 的 值 可 供 管理 服务 器 所 用 (并且 在 许 
多 场合 下 能 够 被 设置 ) 。 一 个 MIB 对 象 可 以 是 : 一 个 计数 器 ， 例 如 由 于 下 数据 报 首 
部 差错 而 由 路 由 器 丢弃 的 卫 数据 报 的 数量 ， 或 一 台 主 机 接收 到 的 UDP 报 文 段 的 数 
量 ; 运行 在 一 台 DNS 服务 器 上 的 软件 版 本 的 描述 性 信息 ; 诸如 一 个 特定 设备 功能 
是 否 正确 的 状态 信息 ; 或 诸如 到 一 个 目的 地 的 路 由 选择 路 径 的 特定 协议 的 信息 。 
MIB 对 象 由 称 为 SMI (Structure of Management Information) [RFC 2578; RFC 2579; 
RFC 2580] 的 数据 描述 语言 所 定义 。 使 用 形式 化 定义 语言 可 以 确保 网 络 管理 数据 的 
语法 和 语义 是 定义 良好 的 和 无 二 义 性 的 。 相 关 的 MIB 对 象 被 收集 在 MIB 模块 
(module) 中 。 到 2015 年 年 中 ，RFC 定义 了 大 约 400 个 MIB 模块 ,还 有 大 量 厂商 特 
定 的 (专用 的 ) MIB 模块 。 

在 每 个 被 管 设备 中 还 驻 留 有 网 络 管理 代理 (network management agent), ， 它 是 运行 
在 被 管 设备 中 的 一 个 进程 ， 该 进程 与 管理 服务 器 通信 ， 在 管理 服务 器 的 命令 和 控制 
下 在 被 管 设备 中 采取 本 地 动作 。 网 络 管理 代理 类 似 于 我 们 在 图 5-2 中 看 到 的 路 由 选 
择 代 理 。 

网 络 管理 框架 的 最 后 组 件 是 网 络 管理 协议 (network management protocol), HDi 
运行 在 管理 服务 器 和 被 管 设 备 之 间 ， 人 允许 管理 服务 器 查询 被 管 设 备 的 状态 ， 并 经 过 
其 代理 间接 地 在 这 些 设备 上 采取 行动 。 代 理 能 够 使 用 网 络 管理 协议 向 管理 服务 器 通 
知 异 常事 件 〈 如 组 件 故障 或 超过 了 性 能 冰 值 ) 。 重 要 的 是 注意 到 网 络 管理 协议 自己 
不 能 管理 网 络 。 恰 恰 相 反 ， 它 为 网 络 管理 员 提 供 了 一 种 能 力 ， 使 他 们 能 够 管理 
(“ 监 视 、 测 试 、 轮 询 、 配 置 、 分 析 、 评 价 和 控制 " ) 网 络 。 这 是 一 种 细微 但 却 重要 
的 区 别 。 在 下 节 中 ， 我 们 将 讨论 因特网 的 SNMP 协议 。 


5.7.2 简单 网 络 管理 协议 


简单 网 络 管理 协议 (Simple Network Management Protocol) 版 本 2 (SNMPv2) [RFC 
3416] 是 一 个 应 用 层 协议 ， 用 于 在 管理 服务 器 和 代表 管理 服务 器 执行 的 代理 之 间 传 递 网 络 
管理 控制 和 信息 报 文 。SNMP 最 常 使 用 的 是 请 求 响 应 模式 ， 其 中 SNMP 管理 服务 器 向 
SNMP 代理 发 送 一 个 请 求 ， 代 理 接收 到 该 请 求 后 ， 执 行 某 些 动作 ， 然 后 对 该 请 求 发 送 一 个 
回答 。 请 求 通常 用 于 查询 (检索 ) 或 修改 (设置 ) 与 某 被 管 设备 关联 的 MIB 对 象 值 。 
SNMP 第 二 个 常 被 使 用 的 是 代理 向 管理 服务 器 发 送 的 一 种 非 请 求 报 文 ， 该 报 文 称 为 陷阱 报 
文 (trap message) 。 陷 阱 报 文 用 于 通知 管理 服务 器 ， 一 个 异常 情况 〈 例 如 一 个 链 路 接口 启 
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动 或 关闭 ) 已 经 导致 了 MIB 对 象 值 的 改变 。 
表 5-2 中 显示 了 SNMPv2 定义 的 7 种 类 型 的 报 文 ， 这 些 报 文 一 般 称 为 协议 数据 单元 
(PDU ) o 5-21 显示 了 这 些 PDU 的 格式 。 


表 5-2 SNMPv2 PDU 类 型 


SNMPv2 PDU 类 型 发 送 方 -接收 方 描述 
GetRequest 管理 者 到 代理 取得 一 个 或 多 个 MIB 对 象 实例 值 
GetNextRequest 管理 者 到 代理 取得 列表 或 表格 中 下 一 个 MIB 对 象 实例 值 
GetBulkRequest 管理 者 到 代理 以 大 数据 块 方式 取得 值 ， 例 如 大 表 中 的 值 
InformRequest 管理 者 到 管理 者 向 不 能 访问 的 远程 管理 实体 通知 MIB 值 
SetRequest 管理 者 到 代理 设置 一 个 或 多 个 MIB 对 象 实例 的 值 
Response 代理 到 管理 者 或 管理 者 对 GetRequest, GetNextRequest, GetBulkRequest, SetRequest 
到 管理 者 PDU， 或 InformRequest 产生 的 响应 
SNMPv2 — Trap 代理 到 管理 者 向 管理 者 通知 一 个 异常 事件 
Get/Set 首 部 Get/Set 的 变量 
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SNMP PDU 
图 5-21 SNMP PDU 格式 


© GetRequest、GetNextRequest 和 GetBulkRequest PDU 都 是 管理 服务 器 向 代理 发 送 的 ， 
以 请 求 位 于 该 代理 所 在 的 被 管 设备 中 的 一 个 或 多 个 MIB 对 象 值 。 其 值 被 请 求 的 MIB 
对 象 的 对 象 标 识 符 定 义 在 该 PDU 的 变量 绑 定 部 分 。CGCetRequest、GetNextRequest 和 
GetBulkRequest 的 差异 在 于 它们 的 数据 请 求 粒度 。GetRequest 能 够 请 求 MIB 值 的 任 
BRA; 多 个 GetNextRequest 能 用 于 顺序 地 读 取 MIB 对 象 的 列表 或 表格 ;Get- 
BulkRequest 允许 读 取 大 块 数据 ， 能 够 避免 因 发 送 多 个 GetRequest 或 GetNextRequest 
报 文 可 能 导致 的 额外 开销 。 在 所 有 这 三 种 情况 下 ， 代 理 用 包括 该 对 象 标识 符 和 它们 
相关 值 的 Response PDU 进行 响应 。 

。 管理 服务 器 使 用 SetRequest PDU 来 设置 位 于 被 管 设备 中 的 一 个 或 多 个 MIB WRN 
值 。 代 理 用 带 有 “noError” 差 错 状态 的 Response PDU 进行 应 答 ， 以 证 实 该 值 的 确 
已 被 设置 。 

© 管理 服务 器 使 用 InformRequest PDU 来 通知 另 一 个 MIB 信息 管理 服务 器 ， 后 者 对 于 
接收 服务 器 是 远程 的 。 

© Response PDU 通常 从 被 管 设备 发 送 给 管理 服务 器 ， 以 响应 来 自 该 服务 器 的 请 求 报 
文 ， 返回 所 请 求 的 信息 。 
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e SNMPv2 PDU 的 最 后 一 种 类 型 是 陷阱 报 文 。 陷 阱 报 文 是 异步 产生 的 ， 即 它们 不 是 为 
了 响应 接收 到 的 请 求 而 产生 的 ， 而 是 为 了 响应 管理 服务 器 要 求 通知 的 事件 而 产生 
的 。RFC 3418 定义 了 周知 的 陷阱 类 型 ， 其 中 包括 设备 的 冷 启动 或 热 启 动 、 链 路 就 
绪 或 故障 、 找 不 到 相 邻 设备 ， 或 鉴别 失效 事件 。 接 收 到 的 陷阱 请 求 不 要 求 从 管理 服 
务 器 得 到 响应 。 

考虑 到 SNMPv2 请 求 响应 性 质 ， 这 时 需要 注意 到 尽管 SNMP PDU 能 够 通过 许多 不 同 的 
运输 协议 传输 ， 但 SNMP PDU 通常 是 作为 UDP 数据 报 的 载荷 进行 传输 的 。RFC 3417 的 确 
表明 UDP 是 “首选 的 运输 映射 ” 。 然 而 ,由 于 UDP 是 一 种 不 可 靠 的 运输 协议 ， 因 而 不 能 
确保 一 个 请 求 或 它 的 响应 能 够 被 它 希望 的 目的 地 接收 到 。 管 理 服务 器 用 该 PDU 的 请 求 ID 
字段 为 它 向 代理 发 送 的 请 求 编号 ; 该 代理 的 响应 从 接收 到 的 请 求 中 获取 它 的 请 求 ID, Al 
此 ， 该 请 求 ID 字段 能 被 管理 服务 器 用 来 检测 丢失 的 请 求 或 回答 。 如 果 在 一 定时 间 后 还 没 
有 收 到 对 应 的 响应 ， 由 管理 服务 器 来 决定 是 否 重 传 一 个 请 求 。 特 别 是 ，SNMP 标准 没有 强 
制 任何 特殊 的 重 传 过 程 ， 即 使 初始 进行 重 传 。 它 只 是 要 求 管理 服务 器 “需要 根据 重 传 的 频 
率 和 周期 做 出 负责 任 的 动作 ”。 当 然 ， 这 使 人 想 知道 一 个 “负责 任 的 ”协议 应 当 如 何 
动作 ! 

SNMP 经 历 了 3 个 版 本 的 演变 。SNMPv3 的 设计 者 说 过 “SNMPv3 能 被 认为 是 具有 附加 
安全 性 和 管理 能 力 的 SNMPv2”[ RFC 3410], SNMPv3 无 疑 在 SNMPv2 基础 上 有 改变 ， 而 
没有 什么 比 在 管理 和 安全 领域 的 变化 更 为 明显 。 在 SNMPv3 中 ， 安 全 性 的 中 心地 位 特别 重 
要 ， 因 为 缺乏 适当 的 安全 性 导致 SNMP 主要 用 于 监视 而 不 是 控制 (例如 ,在 SNMPvl 中 很 
少 使 用 SetRequest) 。 我 们 再 一 次 看 到 安全 性 是 重要 的 关注 点 (安全 性 是 第 8 章 详细 学 习 的 
主题 ) ， 尽 管 认识 到 它 的 重要 性 也 许 有 些 迟 了 ， 但 “亡羊补牢 ， 犹 未 为 晚 ”。 
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” 我 们 现在 已 经 完成 了 进入 网 络 核心 的 两 章 旅程 ， 即 开始 于 第 4 章 的 网 络 层 数据 平面 的 
学 习 和 本 章 完 成 的 网 络 层 控制 平面 的 学 习 。 我 们 知道 了 控制 平面 是 网 络 范 围 的 逻辑 ， 它 不 
仅 控 制 从 源 主机 到 目的 主机 沿 着 端 到 端 路 径 在 路 由 器 之 间 如 何 转 发 数据 报 ， 而 且 控 制 网 络 
层 组 件 和 服务 器 如 何 配置 和 管理 。 

我 们 学 习 了 构建 控制 平面 有 两 大 类 方法 : 传统 的 每 路 由 器 控制 (其 中 在 每 台 路 由 器 中 
运行 算法 ， 并且 路 由 器 中 的 路 由 选择 组 件 与 其 他 路 由 器 中 的 路 由 选择 组 件 通 信 ) 和 软件 定 
义 网 络 (SDN) 控制 (其 中 一 个 逻辑 上 集中 的 控制 器 计算 并 向 每 台 路 由 器 分 发 转发 表 为 它 
们 所 用 ) 。 我 们 在 5. 2 节 中 学 习 了 两 种 基本 的 路 由 选择 算法 ， 即 链 路 状态 和 距离 矢量 ,用 
于 计算 图 中 的 最 小 开销 路 径 ; 这 些 算法 在 每 路 由 器 控制 和 SDN 控制 中 都 有 应 用 。 这 些 算 
法 是 两 种 广泛 部 署 的 因特网 路 由 选择 协议 OSPF 和 BGP 的 基础 ， 我 们 在 5.3 节 和 5.4 节 中 
讨论 了 这 两 种 协议 。 我 们 在 5.5 节 中 讨论 了 网 络 层 控制 平面 的 SDN 方法 ， 研 究 了 SDN 网 
络 控制 应 用 程序 、SDN 控制 器 ， 以 及 控制 器 和 SDN 控制 设备 之 间 通 信 所 使 用 的 OpenFlow 
协议 。 在 5.6 节 和 5.7 节 中 ,我们 包括 了 管理 他 网 络 的 某 些 技术 细节 : ICMP (互联 网 控 
制 报 文 协议 ) 和 SNMP (简单 网 络 管理 协议 ) 。 

在 完成 了 网 络 层 学 习 之 后 ,我们 的 旅行 此 时 沿 着 协议 栈 向 下 走 了 一 步 ， 即 到 了 链 路 
层 。 像 网 络 层 一 样 ， 链 路 层 是 每 台 网 络 连接 的 设备 的 一 部 分 。 但 我 们 将 在 下 一 章 中 看 到 ， 
链 路 层 的 任务 是 在 相同 链 路 或 局 域 网 之 间 更 局 域 化 地 移动 分 组 。 尽 管 这 种 任务 从 表面 上 看 
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可 能 比 网 络 层 任务 简单 得 多 ， 但 我 们 将 看 到 ， 链 路 层 涉及 许多 重要 和 引 人 人 和 人 胜 的 问题 ， 这 
些 问题 会 花费 我 们 不 少时 间 。 


课 后 习题 和 问题 





5.1 节 

Ri. 基于 每 路 由 器 控制 的 控制 平面 意味 着 什么 ? 在 这 种 情况 下 ， 当 我 们 说 网 络 控制 平面 和 数据 平面 是 
“整体 地 ”实现 时 ， 是 什么 意思 ? 

R2. 基于 逻辑 上 集中 控制 的 控制 平面 意味 着 什么 ? 在 这 种 有 情况 下 ， 数 据 平 面 和 控制 平面 是 在 相同 的 设 
备 或 在 分 离 的 设备 中 实现 的 吗 ? 请 解释 。 

5.27 

R3. 比较 和 对 照 集中 式 和 分 布 式 路 由 选择 算法 的 性 质 。 给 出 一 个 路 由 选择 协议 的 例子 ， 该 路 由 选择 协议 
采用 分 布 式 方法 和 集中 式 方 法 。 

R4. 比较 和 对 照 链 路 状态 和 距离 矢量 这 两 种 路 由 选择 算法 。 

R5. 在 距离 矢量 路 由 选择 中 的 “无 穷 计数 ”是 什么 意思 ? 

R6. 每 个 自治 系统 使 用 相同 的 AS 内 部 路 由 选择 算法 是 必要 的 吗 ? 说 明 其 原因 。 

5.3~5.4 节 

R7. 为 什么 在 因特网 中 用 到 了 不 同 的 AS 间 与 AS 内 部 协议 ? 

R8. 是 非 判 断 题 ， 当 一 台 OSPF 路 由 器 发 送 它 的 链 路 状态 信息 时 ， 它 仅 向 那些 直接 相 邻 的 节点 发 送 。 解 释 
理由 。 

R9. 在 OSPF 自治 系统 中 区 域 表 示 什 么 ? 为 什么 引入 区 域 的 概念 ? 

R10. 定义 和 对 比 下 列 术 语 : 子 网 、 前 级 和 BGP Bw, 

R11. BGP 是 怎样 使 用 NEXT-HOP 属性 的 ? 它 是 怎样 使 用 AS-PATH 属性 的 ? 

R12. 描述 一 个 较 高 层 ISP 的 网 络 管理 员 在 配置 BGP 时 是 如 何 实现 策略 的 。 

R13. 是 非 判 断 题 : 当 BCP 路 由 器 从 它 的 邻居 接收 到 一 条 通告 的 路 径 时 ， 它 必须 对 接收 路 径 增加 上 它 自 
己 的 标识 ， 然 后 向 其 所 有 邻居 发 送 该 新 路 径 。 解 释 理由 。 

5.5% 

R14. 描述 在 SDN 控制 器 中 的 通信 层 、 网 络 范围 状态 管理 层 和 网 络 控制 应 用 程序 层 的 主要 任务 。 

R15. 假定 你 要 在 SDN 控制 平面 中 实现 一 个 新 型 路 由 选择 协议 。 你 将 在 哪个 层次 中 实现 该 协议 ? 解释 
理由 。 

R16. 什么 类 型 的 报 文 流 跨 越 SDN 控制 器 的 北向 和 南 向 API? 谁 是 从 控制 器 跨越 南 向 接口 发 送 的 这 些 报 文 
的 接收 者 ? 谁 是 跨越 北向 接口 从 控制 器 发 送 的 这 些 报 文 的 接收 者 ? 

R17. 描述 两 种 从 受 控 设备 到 控制 器 发 送 的 OpenFlow 报 文 (由 你 所 选 ) 类 型 的 目的 。 描 述 两 种 从 控制 器 
到 受 控 设备 发 送 的 OpenFlow 报 文 ( 由 你 所 选 ) 类 型 的 目的 。 

R18. 在 OpenDaylight SDN 控制 器 中 服务 抽象 层 的 目的 是 什么 ? 

5.6 ~5.7 $ 

R19, 列举 4 种 不 同类 型 的 ICMP 报 文 。 

R20. 在 发 送 主机 执行 Traceroute 程序 ， 收 到 哪 两 种 类 型 的 ICMP 报 文 ? 

R21. 在 SNMP 环境 中 定义 下 列 术语 : 管理 服务 器 、 被 管 设 备 、 网 络 管理 代理 和 MIB, 

R22. SNMP GetRequest 和 SetRequest 报 文 的 目的 是 什么 ? 

R23. SNMP 陷阱 报 文 的 目的 是 什么 ? 
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P4. 


习题 


Pl. 观察 图 5-3， 列 举 从 y 到 不 包含 任何 环 路 的 路 径 。 
P2. 
P3. 考虑 下 面 的 网 络 。 对 于 标明 的 链 路 开销 ， 用 Dijkstra 的 最 短路 算法 计算 出 从 x 到 所 有 网 络 节点 的 最 短 


重复 习题 P1， 列 举 从 x 到 z、z 到 之 以 及 z 到 如 的 不 包含 任何 环 路 的 路 径 。 


路 径 。 通 过 计算 一 个 类 似 于 表 5-1 的 表 ， 说 明 该 算法 是 如 何 工作 的 。 





考虑 习题 P3 中 所 示 的 网 络 。 使 用 Dijkstra 算法 和 一 个 类 似 于 表 5-1 的 表 来 说 明 你 做 的 工作 : 
a 计算 出 从 1 到 所 有 网 络 节点 的 最 短路 径 。 
b. 计算 出 从 w 到 所 有 网 络 节 点 的 最 短路 径 。 
c. 计算 出 从 v 到 所 有 网 络 节点 的 最 短路 径 。 
d. 计算 出 从 w 到 所 有 网 络 节 点 的 最 短路 径 。 
e. 计算 出 从 y 到 所 有 网 络 节点 的 最 短路 径 。 
f 计算 出 从 z 到 所 有 网 络 节点 的 最 短路 径 。 


. 考虑 下 图 所 示 的 网 络 ， 假 设 每 个 节点 初始 时 知道 到 它 的 每 个 邻居 的 开销 。 考 虑 距离 向 量 算法 ， 并 显 


示 在 节点 z 中 的 距离 表 表 项 。 
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. 考虑 一 个 一 般 性 拓扑 ( 即 不 是 以 上 所 显示 的 特定 网 络 ) 和 一 个 同步 版 本 的 距离 向 量 算法 。 假 设 每 次 


迭代 时 ， 一 个 节点 与 其 邻居 交换 其 距离 向 量 并 接收 它们 的 距离 向 量 。 假 定 算法 开始 时 ， 每 个 节点 只 
知道 到 其 直接 邻居 的 开销 ， 在 该 分 布 式 算法 收敛 前 所 需 的 最 大 迭代 次 数 是 多 少 ? 评估 你 的 答案 。 


. 考虑 下 图 所 示 的 网 络 段 。x 只 有 两 个 相连 邻居 与 y。w 有 一 条 通 向 目的 地 vw (没有 显示 ) 的 最 低 开 


销路 径 ， 其 值 为 5，y 有 一 条 通 向 目的 地 的 最 低 开 销路 径 ， 其 值 为 6。 从 w 与 y 到 w (以 及 w 与 y 之 
E) 的 完整 路 径 未 显示 出 来 。 网 络 中 所 有 链 路 开销 皆 为 正 整 数值 。 
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P8. 


P9. 


P10. 


Pip, 


P12. 
P13: 
P14. 


P15. 





b. 给 出 对 于 c(x, w) Relx, y) 的 链 路 开销 的 变化 ， 使 得 执行 了 距离 向 量 算法 后 ，x 将 通知 其 邻居 
有 一 条 通 向 的 新 最 低 开销 路 径 。 

c. 给 出 对 c(x, w) 或 ec(x，y) 的 链 路 开销 的 变化 ， 使 得 执行 了 距离 向 量 算法 后 ,x 将 不 通知 其 邻居 
有 一 条 通 向 x 的 新 最 低 开销 路 径 。 

考虑 如 图 5-6 中 所 示 3 个 节点 的 拓扑 。 不 使 用 显示 在 图 5-6 中 的 开销 值 ， 链 路 开销 值 现在 是 c(x, y) =3, c 

(y, z) =6，c(z, x) =4。 在 距离 向 量 表 初 始 化 后 和 在 同步 版 本 的 距离 向 量 算法 每 次 迭代 后 ,计算 它 

的 距离 向 量 表 (如 我 们 以 前 对 图 5-6 讨论 时 所 做 的 那样 ) 。 

考虑 距离 向 量 路 由 选择 中 的 无 穷 计数 问题 。 如 果 我 们 减 小 一 条 链 路 的 开销 ， 将 会 出 现 无 穷 计 数 问题 

吗 ? 为 什么 ?如 果 我 们 将 没有 链 路 的 两 个 节点 连接 起 来 ， 会 出 现 什么 情况 ? 

讨论 图 5-6 中 的 距离 向 量 算法 ， 距 离 向 量 D(x) 中 的 每 个 值 不 是 递增 的 并 且 最 终 将 在 有 限 步 中 稳定 

下 来 。 

考虑 图 5-7。 假 定 有 另 一 台 路 由 器 w， 与 路 由 器 y 和 z 连接 。 所 有 链 路 的 开销 给 定 如 下 : c(x, y) = 

4, e(x, z) =50, c(y, w) =1, c(z, w) =1, e(y, z) =3。 假 设 在 距离 向 量 路 由 选择 算法 中 使 用 了 

毒性 逆转 。 

a， 当 距离 向 量 路 由 选择 稳定 时 ， 路 由 器 w、y 和 z 向 x 通知 它们 之 间 的 距离 。 它 们 告诉 彼此 什么 样 
的 距离 值 ? 

b. 现在 假设 x F y 之 间 的 链 路 开销 增加 到 60。 如 果 使 用 了 毒性 逆转 ， 将 会 存在 无 穷 计数 问题 吗 ? 为 
什么 ? 如 果 存 在 无 穷 计 数 问 题 ， 距 离 向 量 路 由 选择 需要 多 少 次 迭代 才能 再 次 到 达 稳 定 状态 ? 评估 
你 的 答案 。 

c WIR ely, x) 从 4 变化 到 60， 怎 样 修改 c(y，z) 使 得 不 存在 无 穷 计数 问题 。 

描述 在 BGP 中 是 如 何 检测 路 径 中 的 环 路 的 。 

BGP 路 由 器 将 总 是 选择 具有 最 短 AS 路 径 长 度 的 无 环 路 由 吗 ? 评估 你 的 答案 。 

考虑 下 图 所 示 的 网 络 。 假 定 AS3 和 AS2 正在 运行 OSPF 作为 其 AS 内 部 路 由 选择 协议 。 假 定 AS1 和 

AS4 正在 运行 RIP 作为 其 AS 内 部 路 由 选择 协议 。 假 定 AS 间 路 由 选择 协议 使 用 的 是 eBGP 和 iBGP, 

假定 最 初 在 AS2 和 AS4 之 间 不 存在 物理 链 路 。 

a. 路 由 器 3c 从 下 列 哪个 路 由 选择 协议 学 习 到 了 前 级 x*: OSPF, RIP, eBGP 或 iBGP? 

b. 路 由 器 3a 从 哪个 路 由 选择 协议 学 习 到 了 前 缀 x? 

c. 路 由 器 Le 从 哪个 路 由 选择 协议 学 习 到 了 前 级 x? 

d. 路 由 器 1d 从 哪个 路 由 选择 协议 学 习 到 了 前 缀 x? 


» 





参考 前 面 习题 P14, 一旦 路 由 器 1d 知道 了 x 的 情况 ， 它 将 一 个 表 项 (x, 1) 放 入 它 的 转发 表 中 。 

a 对 这 个 表 项 而 言 , KFF LEE L? 用 一 句 话 解释 其 原因 。 

b. 现在 假定 在 AS2 和 AS4 之 间 有 一 条 物理 链 路 ， 显 示 为 图 中 的 虚线 。 假 定 路 由 器 1d 知道 经 AS2 以 
及 经 AS3 能 够 访问 到 x。7 将 设置 为 用 还 是 1,? 用 一 句 话 解释 其 原因 。 

c. 现在 假定 有 另 一 个 AS， 它 称 为 AS5， 其 位 于 路 径 AS2 和 AS4 之 间 (没有 显示 在 图 中 )。 假 定 路 由 
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器 1d 知道 经 AS2 ASS AS4 以 及 经 过 AS3 AS4 能 够 访问 到 x。7 将 设置 为 还 是 有? 用 一 句 话 解释 
其 原因 。 

P16. 考虑 下 面 的 网 络 。ISP B 为 地 区 ISP A 提供 国家 级 主干 服务 。ISP C 为 地 区 ISP D 提供 国家 级 主干 服 
务 。 每 个 ISP 由 一 个 AS 组 成 。B 和 C 使 用 BGP， 在 两 个 地 方 互相 对 等 。 考 虑 从 A 到 DD 的 流量 。B 
愿意 将 流量 交 给 C 传 给 西海 岸 (使 得 C 将 承担 承载 跨越 整个 国家 的 流量 开销 ) ， 而 C 愿意 经 其 东海 
岸 与 B 对 等 的 站 点 得 到 这 些 流 量 (使 得 B 将 承载 跨越 整个 国家 的 流量 )。C 可 能 会 使 用 什么 样 的 
BGP 机 制 ， 使 得 B 将 通过 东海 岸 对 等 点 传递 A 到 D 的 流量 ? 要 回答 这 个 问题 ， 你 需要 钻研 BGP 
规范 。 





P17. 在 图 5-13 中 , 考虑 到 达 桩 网 络 W、X 和 YY 的 路 径 信 息 。 基 于 WW 与 X 处 的 可 用 信息 ,它们 分 别 看 到 
的 网 络 拓扑 是 什么 评估 你 的 答案 。Y 所 见 的 拓扑 视图 如 下 图 所 示 。 


a x 


CC | 桩 网 络 Y 所 见 拓扑 视图 


P18. 考虑 图 5-13。B 将 不 会 基于 BCP 路 由 选择 ,经 过 X 以 了 为 目的 地 转发 流量 。 但 是 有 某 些 极为 流行 
的 应 用 程序 ， 其 数据 分 组 先 朝 向 X， 然 后 再 流向 Y。 指 出 一 种 这 样 的 应 用 程序 ， 描 述 数 据 分 组 是 如 
何 沿 着 这 条 未 由 BGP 路 由 选择 所 给 定 的 路 径流 动 的 。 

P19. 在 图 5-13 中 ， 假 定 有 另 一 个 桩 网 络 V， 它 为 ISP A 的 客户 。 假设 B 和 C 具有 对 等 关系 , 并 且 A 是 B 
和 C 的 客户 。 假 设 A 希望 让 发 向 W 的 流量 仅 来 自 B， 并 且 发 向 V 的 流量 来 自 B 或 C。A 如 何 向 B 和 
C 通告 其 路 由 ? C 收 到 什么 样 的 AS 路 由 ? 

P20. 假定 AS X 和 2Z 不 直接 连接 ,但 与 AS Y 连接 。 进 一 步 假定 X 与 Y 具 有 对 等 协定 ，Y 与 Z 具有 对 等 协 
定 。 最 后 ,假定 Z 要 传送 所 有 YY 的 流量 但 不 传送 X 的 流量 。BGP 允许 Z 实现 这 种 策略 吗 ? 

P21. 考虑 在 管理 实体 和 被 管 设备 之 间 发 生 通 信 的 两 种 方式 : 请 求 响 应 方式 和 陷阱 方式 。 从 以 下 方面 考虑 
这 两 种 方式 的 优 缺点 : 四 开销 ; @@ 当 异常 事件 出 现时 通知 的 时 间 ; @ 对 于 管理 实体 和 设备 之 间 丢 失 
报 文 的 健壮 性 。 

P22. 在 5.7 节 中 我 们 看 到 ， 用 不 可 靠 的 UDP 数据 报 传输 SNMP 报 文 是 更 可 取 的 方式 。 请 考虑 SNMP 设计 
者 选择 UDP 而 不 是 TCP 作为 SNMP 运输 协议 的 理由 。 


ZX, 套 接 字 编 程 作业 


在 第 2 章 结尾 给 出 了 4 个 套 接 字 编 程 作业 。 下 面 给 出 第 5 个 应 用 ICMP 的 作业 (ICMP 的 是 本 章 讨论 
的 协议 ) 。 
作业 5: ICMP ping 


ping 是 一 种 流行 的 网 络 应 用 程序 ， 用 于 测试 位 于 远程 的 某 个 特定 的 主机 是 否 开机 和 可 达 。 它 也 经 常 
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用 于 测量 客户 主机 和 目标 主机 之 间 的 时 延 。 它 的 工作 过 程 是 : 向 目标 主机 发 送 ICMP“ 回 显 请 求 ”分 组 
( 即 ping 分 组 ) ， 并 且 侦 听 ICMP“ 回 显 响应 ”应 答 〈( 即 pong 分 组 ) ping 测量 RRT、 记 录 分 组 丢失 和 计 
HA ping-pong 交换 (往返 时 间 的 最 小 、 平 均 、 最 大 和 标准 差 ) 的 统计 汇总 。 

在 本 实验 中 ,读者 将 用 Python 语言 编写 自己 的 ping 应 用 程序 。 该 应 用 程序 将 使 用 ICMP。 但 为 了 保 
持 程序 的 简单 ， 将 不 完全 遵循 RFC 1739 中 的 官方 规范 。 注 意 到 仅 需 要 写 该 程序 的 客户 程序 ， 因 为 服务 器 
侧 所 需 的 功能 构建 在 几乎 所 有 的 操作 系统 中 。 读 者 能 够 在 Web 站 点 http://www. pearsonhighered. com/cs- 
resources 找到 本 作业 的 全 面 细 节 ， 以 及 该 Python 代码 的 重要 片段 。 


A ak 


在 本 编程 作业 中 ， 需 要 写 一 组 “分 布 式 ” 程 序 ， 以 为 下 图 所 示 的 网 络 实现 一 个 分 布 式 异 步 距离 向 量 
路 由 选择 算法 。 





2 

要 写 出 下 列 例 程 ， 这 些 例 程 将 在 为 该 作业 提供 的 模拟 环境 中 异步 “执行 ” 。 对 于 节点 0， 将 要 写 出 这 
样 的 例 程 : 

e rtinit0() 。 在 模拟 开始 将 调用 一 次 该 例 程 。rtinit0 () 无 参数 。 它 应 当初 始 化 节点 0 中 的 距离 表 ， 

以 反映 出 到 达 节 点 1、2 和 3 的 直接 开销 分 别 为 1、3 和 7。 在 上 图 中 ， 所 有 链 路 都 是 双向 的 ， 两 
个 方向 的 开销 皆 相 同 。 在 初始 化 距离 表 和 节点 0 的 例 程 所 需 的 其 他 数据 结构 后 ， 它 应 向 其 直接 
连接 的 邻居 (在 本 情况 中 为 节点 1、2 和 3) 发 送 它 到 所 有 其 他 网 络 节点 的 最 低 开 销路 径 的 开销 
信息 。 通 过 调用 例 程 tolayer2() ， 这 种 最 低 开 销 信息 在 一 个 路 由 选择 更 新 分 组 中 被 发 送 给 相 邻 节 
点 ， 就 像 在 完整 编程 作业 中 描述 的 那样 。 路 由 选择 更 新 分 组 的 格式 也 在 完整 编程 作业 中 进行 
描述 。 

© rtupdate0( struct rtpkt *#rcvdpkt) 。 当 节点 0 收 到 一 个 由 其 直接 相连 邻居 之 一 发 给 它 的 路 由 选择 分 

组 时 ， 调 用 该 例 程 。 参 数 * rcvdpkt 是 一 个 指向 接收 分 组 的 指针 。rtupdate0() 是 距离 向 量 算法 的 
“核心 ”"。 它 从 其 他 节点 i 接收 的 路 由 选择 更 新 分 组 中 包含 节点 i 到 所 有 其 他 网 络 节点 的 当前 最 
短路 径 开销 值 。rtupdate0() 使 用 这 些 收 到 的 值 来 更 新 其 自身 的 距离 表 (这 是 由 距离 向 量 算法 所 
规定 的 ) 。 如 果 它 自己 到 另外 节点 的 最 低 开销 由 于 此 更 新 而 发 生 改 变 的 话 ， 则 节点 0 通过 发 送 一 
个 路 由 选择 分 组 来 通知 其 直接 相连 邻居 这 种 最 低 开 销 的 变化 。 我 们 在 距离 向 量 算法 中 讲 过 ， 仅 
有 直接 相连 的 节点 才 交 换 路 由 选择 分 组 。 因 此 ， 节 点 1 和 节点 2 将 相互 通信 ， 但 节点 1 和 节点 3 
将 不 相互 通信 。 

为 节点 1、2、3 定义 类 似 的 例 程 。 因 此 你 总 共 将 写 出 8 个 例 程 : rtinit0 () rtinitl () rtinit2 () 、 
rtinit3() 、rtupdate0() 、rtupdatel () 、rtupdate2() 和 rtupdate3() 。 这 些 例 程 将 共同 实现 一 个 分 布 式 的 、 与 图 
中 所 示 拓 扑 和 开销 相关 的 距离 表 的 异步 计算 。 

读者 可 在 网 址 http://www. pearsonhighered. com/cs- resources 处 找到 该 编程 作业 的 全 部 详细 资料 ， 以 及 
创建 模拟 硬件 /软件 环境 所 需 的 C 程序 代码 。 一 个 Java 版 的 编程 作业 也 可 供 使 用 。 


时 Wireshark 实验 


在 本 书 配套 的 Web 站 点 www. pearsonhighered. com/cs- resource 上 ， 将 找到 一 个 Wireshark 实验 作业 ， 
该 作业 考察 了 在 ping 和 traceroute 命令 中 ICMP 协议 的 使 用 。 
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Jennifer Rexford 是 美国 普林斯顿 大 学 计算 机 科学 系 的 教授 。 她 的 研究 
有 宏大 的 目标 : 使 计算 机 网 络 更 容易 设计 和 管理 ， 特 别 强调 路 由 选择 协 
议 。1996 ~ 2004 年 ， 她 在 ATAT 实验 室 网 络 管理 和 性 能 部 工作 。 在 AT&T 
期 间 ， 她 设计 了 用 于 网 络 测量 、 流 量 工程 和 路 由 器 配置 的 技术 和 工具 ， 这 
些 技 术 和 工具 部 署 在 AT&T 的 主干 网 络 。Jennifer 是 《Web 协议 和 实践 : 
网 络 协议 、 高 速 缓存 和 流量 测量 》 (Web Protocols and Practice; Networking 
Protocols, Caching, and Traffic Measurement) 一 书 的 合作 者 ， 该 书 由 Addi- 
son- Wesley 出 版 社 于 2001 年 5 月 出 版 。 她 在 2003 ~ 2007 年 担任 ACM SIG- 
COMM 主席 一 职 。 于 1991 年 从 普林斯顿 大 学 电气 工程 获得 学 士 学 位 ， 并 Jennifer Rexford 
于 1996 年 从 密 西 根 大 学 电气 工程 和 计算 机 科学 获得 博士 学 位 。 在 2004 年 ， 
Jennifer 赢得 了 ACM 的 计算 机 专业 杰出 青年 Grace Murray Hopper 奖 ， 并 入 列 35 岁 以 下 顶级 创新 
家 的 MIT TR-100 名 单 。 








。 请 描述 在 您 的 职业 生涯 中 干 过 的 一 两 个 最 令 人 激动 的 项 目 。 工 作 中 最 大 的 挑战 是 什么 ? 

HRE ATAT 的 研究 员 时 ,我 们 一 群 人 设计 了 一 种 管理 因特网 服务 提供 商 主 干 网 络 路 由 的 新 方法 。 
传统 上 ， 网 络 操作 员 逐 个 配置 每 台 路 由 器 ， 并 且 这 些 路 由 器 运行 分 布 式 协议 以 计算 通过 该 网 络 的 路 径 。 
我 们 认为 如 果 网 络 操 作 员 能 够 基于 网 络 范围 拓扑 和 流量 的 视图 直接 控制 路 由 器 如 何 转 发 流量 ， 网 络 管理 
将 更 为 简单 和 灵活 。 我 们 设计 并 建造 的 路 由 控制 平台 (RCP) 能 够 在 一 台 商 用 计算 机 上 为 所 有 AT&T E 
干 计算 路 径 ， 并且 能 够 不 加 修改 地 控制 老式 路 由 器 。 对 我 而 言 ， 这 个 项 目 是 令 人 兴奋 的 ， 因 为 我 们 有 一 
个 刺激 性 的 想法 、 一 个 工作 的 系统 以 及 最 终 在 一 个 运营 的 网 络 中 实际 部 署 。 快 速 向 前 走 了 几 年 ， 软 件 定 
义 网 络 (SDN) 已 经 成 为 一 种 主流 技术 ,标准 协议 (如 OpenFlow) 可 以 告诉 底层 的 交换 机 做 些 什么 更 为 
容易 。 

。 您 认为 软件 定义 网 络 未 来 应 当 如 何 演进 ? 

与 以 往 最 大 的 不 同 之 处 在 于 ， 控 制 平面 软件 能 够 由 许多 不 同 的 程序 员 创建 ， 而 不 只 是 由 销售 网 络 设 
备 的 公司 生成 。 同 时 不 像 在 服务 器 或 智能 手机 上 运行 的 应 用 程序 ， 控 制 器 应 用 程序 必须 在 一 起 工作 以 处 
理 相 同 的 流量 。 网 络 操作 员 不 希望 对 某 些 流量 执行 负载 均衡 而 对 其 他 流量 进行 路 由 选择 ; 相反 ,他们 希 
望 在 相同 的 流量 上 执行 负载 均衡 和 路 由 选择 。 未 来 的 SDN 控制 器 平台 应 当 使 独立 编写 的 多 个 控制 器 应 用 
程序 在 一 起 合作 ， 提 供 良好 的 编程 抽象 。 更 一 般 地 ， 良 好 的 编程 抽象 能 够 使 得 生成 控制 器 应 用 程序 更 为 
容易 ， 而 不 必 担 心 诸如 流 表 项 、 流 量 计数 器 、 分 组 首部 的 比特 样式 等 底层 细节 。 此 外 ,虽然 SDN 控制 器 
是 逻辑 上 集中 的 ,但 网 络 仍 然 是 由 分 布 式 设备 集合 组 成 的 。 未 来 的 控制 器 应 当 为 跨 网 络 更 新 流 表 提 供 良 
好 抽象 ， 因 此 应 用 程序 能 够 在 设备 更 新 时 推断 出 传输 中 的 分 组 发 生 了 什么 情况 。 对 控制 平面 软件 的 编程 
抽象 是 一 个 令 人 兴奋 的 计算 机 网 络 、 分 布 式 系统 和 编程 语言 之 间 的 多 学 科研 究 领 域 ， 有 望 在 未 来 几 年 产 
生 实 际 影响 。 

。 您 预见 网 络 和 因特网 的 未 来 往 何 处 发 展 ? 

网 络 是 一 个 令 人 兴奋 的 领域 ， 因 为 应 用 程序 和 底层 技术 无 时 不 在 变化 。 我 们 总 是 在 重 塑 自己 ! 甚至 
在 10 年 前 ， 有 谁 能 够 预测 到 智能 手机 的 一 统 天 下 ， 人 允许 移动 用 户 访问 现 有 应 用 程序 以 及 新 型 基于 位 置 的 
服务 呢 ? 云 计算 的 出 现 从 根本 上 改变 了 用 户 与 他 们 运行 的 应 用 程序 之 间 的 关系 ， 联 网 的 传感器 和 执行 器 
( 物 联网 ) 使 得 大 量 的 新 应 用 (和 安全 脆弱 性 ) 成 为 可 能 ! 创新 的 步伐 真正 令 人 兴奋 不 已 。 

底层 网 络 是 所 有 这 些 创新 中 的 要 素 。 固 然 ， 该 网 络 声名 狼藉 地 “造成 不 便 " : 限制 了 性 能 ， 损 害 了 
可 靠 性 ， 约 束 了 应 用 以 及 使 服务 的 部 署 和 管理 复杂 化 。 我 们 应 当 继 续 努 力 使 得 未 来 的 网 络 就 像 我 们 呼吸 
的 空气 一 样 不 可 见 ， 因 此 网 络 决 不 会 成 为 新 思想 和 有 价值 服务 的 拦路 虎 。 为 此 ， 我 们 需要 在 各 个 网 络 设 
备 和 协议 (以 及 它们 的 首 字母 缩 略 词 ) 之 上 提升 抽象 等 级 ， 使 得 我 们 能 够 对 该 网 络 以 及 用 户 的 高 层 目标 
作为 一 个 整体 进行 推理 。 
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。 是 谁 激发 了 您 的 职业 灵感 ? 

我 在 国际 计算 机 科学 研究 所 长 期 受到 Sally Floyd 的 激励 。 她 的 研究 总 是 有 明确 目标 ， 聚焦 因特网 
面临 的 重要 挑战 。 她 深入 到 困难 问题 之 中 ， 直 到 她 完全 理解 该 问题 和 解 空间 ， 她 将 大 量 精力 专注 于 
“使 得 事情 产生 结果 ”， 例 如 在 协议 标准 化 和 网 络 设 备 中 注入 了 她 的 很 多 思想 。 同 时 ， 通 过 在 许多 标准 
化 和 研究 组 织 的 专业 服务 以 及 通过 创建 工具 (例如 广泛 使 用 的 ns2 和 ns3 模拟 器 ) ， 她 回馈 了 网 络 界 ， 
这 些 工具 使 得 其 他 研究 人 员 取 得 成 功 。 她 于 2009 年 退休 ， 但 她 在 该 领域 的 影响 将 在 未 来 许多 年 内 长 久 
存在 。 

© 您 对 进入 计算 机 科学 和 网 络 领域 的 学 生 有 什么 忠告 吗 ? 

网 络 本 质 上 是 一 个 跨 学 科 的 领域 。 应 用 来 自 其 他 学 科 的 技术 在 网 络 中 取得 重要 突破 ， 这 些 技术 来 
自 不 同 领 域 ， 如 排队 论 、 博 弈 论 、 控 制 论 、 分 布 式 系统 、 网 络 优化 、 编 程 语言 、 机 器 学 习 、 算 法 、 数 
据 结构 等 等 。 我 认为 熟悉 相关 领域 或 与 这 些 领域 的 专家 密切 合作 ， 是 将 网 络 建立 在 更 坚实 基础 上 的 极 
好 方式 ， 这 样 我 们 能 够 学 习 如 何 建造 更 值得 社会 信任 的 网 络 。 除 了 这 些 理论 学 科 以 外 ， 因 为 我 们 能 够 
创造 真实 的 供 人 们 使 用 的 实际 人 造物 品 ， 网 络 是 令 人 激动 的 。 通过 获取 操作 系统 、 计 算 机 体系 结构 等 
方面 的 经 验 ， 掌 握 如 何 设 计 和 建造 系统 是 另 一 种 了 不 起 的 方式 ， 这 可 以 增强 你 的 网 络 知识 ， 有 助 于 使 
得 世界 更 美好 。 
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在 上 一 章 中 ,我 们 学 习 了 网 络 层 提供 的 任意 两 台 主 机 之 间 的 通信 服务 。 在 两 台 主 机 之 
间 ， 数 据 报 跨越 一 系列 通信 和 链 路 传输 ， 一 些 是 有 线 链 路 ， 而 一 些 是 无 线 链 路 ， 从 源 主机 起 
始 ， 通 过 一 系列 分 组 交换 机 《交换 机 和 路 由 器 ) ， 在 目的 主机 结束 。 当 我 们 沿 协议 栈 继续 
往 下 ， 从 网 络 层 到 达 链 路 层 ， 我 们 自然 而 然 地 想 知道 分 组 是 如 何 通过 构成 端 到 端 通信 路 径 
的 各 段 链 路 的 。 为 了 在 单 段 链 路 上 传输 ， 网 络 层 的 数据 报 是 怎样 被 封装 进 链 路 层 帧 的 呢 ? 
沿 此 通信 路 径 ， 不 同 的 链 路 能 够 采用 不 同 的 链 路 层 协议 吗 ? 在 广播 链 路 中 传输 碰撞 是 如 何 
解决 的 ? 在 链 路 层 存 在 编 址 吗 ? 如 果 需 要 ， 链 路 层 编 址 如 何 与 我 们 在 第 4 章 中 学 习 的 网 络 
层 编 址 一 起 运行 呢 ? 交换 机 和 路 由 器 之 间 到 底 有 哪些 差异 ?- 我 们 将 在 本 章 回答 这 些 和 其 他 
一 些 重要 的 问题 。 

在 链 路 层 的 讨论 中 ,我 们 将 看 到 两 种 截然 不 同类 型 的 链 路 层 信道 。 第 一 种 类 型 是 广播 
信道 ， 这 种 信道 用 于 连接 有 线 局 域 网 、 卫 星 网 和 混合 光纤 同 轴 电 缆 (Hybrid Fiber Coaxial 
cable, HFC) 接 人 网 中 的 多 台 主 机 。 因 为 许多 主机 与 相同 的 广播 信道 连接 ， 需 要 所 谓 的 媒 
体 访问 协议 来 协调 帧 传输 。 在 某 些 场合 中 ， 可 以 使 用 中 心 控制 器 来 协调 传输 。 第 二 种 类 型 
的 链 路 层 信 道 是 点 对 点 通信 链 路 ， 这 在 诸如 长 距离 链 路 连接 的 两 台 路 由 器 之 间 ， 或 用 户 办 
公 室 计算 机 与 它们 所 连接 的 邻近 以 太 网 交换 机 之 间 等 场合 经 常 能 够 发 现 。 协 调 对 点 对 点 链 
路 的 访问 较为 简单 ; 在 本 书 Web 网 站 上 的 相关 材料 详细 地 讨论 了 点 到 点 协议 (Point- to- 
Point Protocol, PPP) ， 该 协议 的 适用 范围 从 经 电话 线 的 拨号 服务 到 经 光纤 链 路 的 高 速 点 到 
点 帧 传输 。 

我 们 将 在 本 章 中 探究 几 个 链 路 层 概念 和 技术 。 我 们 将 更 深入 地 研究 差错 检测 和 纠正 ， 
这 个 主题 我 们 在 第 3 章 中 简要 讨论 过 。 我 们 将 考虑 多 路 访问 网 络 和 交换 局 域 网 ， 包 括 以 太 
网 ， 这 是 目前 最 流行 的 有 线 局 域 网 技术 。 我 们 还 将 学 习 虚 拟 局 域 网 和 数据 中 心 网 络 。 尽 管 
WiFi 及 更 一 般 的 无 线 局 域 网 都 属于 链 路 层 范围 ， 但 我 们 将 在 第 7 章 才学 习 这 些 重要 的 
主题 。 


6.1 链 路 层 概述 


我 们 首先 学 习 一 些 有 用 的 术语 。 在 本 章 中 为 方便 讨论 ， 将 运行 链 路 层 协议 〈 即 第 2 
层 ) 协议 的 任何 设备 均 称 为 节点 (node)。 节 点 包括 主机 、 路 由 器 、 交 换 机 和 WiFi 接 人 点 
(在 第 7 章 中 讨论 ) 。 我 们 也 把 沿 着 通信 路 径 连 接 相 邻 节 点 的 通信 信道 称 为 链 路 (link), 
为 了 将 一 个 数据 报 从 源 主 机 传输 到 目的 主机 ， 数 据 报 必 须 通过 沿 端 到 端 路 径 上 的 各 段 链 路 
传输 。 举 例 来 说 ， 显 示 在 图 6-1 下 部 的 公司 网 络 中 ， 考 虑 从 无 线 主机 之 一 向 服务 器 之 一 发 
送 一 个 数据 报 。 该 数据 报 将 实际 通过 6 段 链 路 : 发 送 主机 与 Wiki 接 人 点 之 间 的 WiFi 链 
路 ， 接 人 点 和 链 路 层 交 换 机 之 间 的 以 太 网 链 路 ， 链 路 层 交 换 机 与 路 由 器 之 间 的 链 路 ， 两 台 
路 由 器 之 间 的 链 路 ， 最 后 是 交换 机 和 服务 器 之 间 的 以 太 网 链 路 。 在 通过 特定 的 链 路 时 ， 传 
输 节点 将 数据 报 封装 在 链 路 层 帧 中 ， 并 将 该 帧 传送 到 链 路 中 。 
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图 6-1 无 线 主机 和 服务 器 之 间 的 6 个 链 路 层 跳 


为 了 透彻 理解 链 路 层 以 及 它 是 如 何 与 网 络 层 关 联 的 ， 我 们 考虑 一 个 交通 运输 的 类 比例 
子 。 假 如 一 个 旅行 社 计划 为 游客 开辟 从 美国 新 泽 西 州 的 普林斯顿 到 瑞士 洛桑 的 旅游 路 线 。 
假定 该 旅行 社 认为 对 于 游客 而 言 最 为 便利 的 方案 是 : 从 普林斯顿 乘 豪 华 大 轿车 到 JFK 机 
场 ， 然 后 乘 飞机 从 JEK 机 场 去 日 内 瓦 机 场 ， 最 后 乘 火 车 从 日 内 瓦 机 场 到 洛桑 火车 站 。 一旦 
该 旅行 社 作 了 这 3 项 预定 ,普林斯顿 豪华 大 轿车 公司 将 负责 将 游客 从 普林斯顿 带 到 JFK, 
航空 公司 将 负责 将 游客 从 JEK 带 到 日 内 瓦 ， 瑞 士 火 车 服务 将 负责 将 游客 从 日 内 瓦 带 到 洛 
桑 。 该 旅程 中 3 段 中 的 每 一 段 都 在 两 个 “ 相 邻 ”地 点 之 间 是 “直达 的 ”"。 注 意 到 这 3 段 运 
输 是 由 不 同 的 公司 管理 ,使 用 了 完全 不 同 的 运输 方式 (豪华 大 轿车 、 飞 机 和 火车 )。 尽 管 
运输 方式 不 同 ， 但 它们 都 提供 了 将 旅客 从 一 个 地 点 运输 到 相 邻 地 点 的 基本 服务 。 在 这 个 运 
输 类 比 中 ， 一 个 游客 好 比 一 个 数据 报 ， 每 个 运输 区 段 好 比 一 条 链 路 ， 每 种 运输 方式 好 比 一 
种 链 路 层 协议 ， 而 该 旅行 社 好 比 一 个 路 由 选择 协议 。 
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6.1.1 链 路 层 提供 的 服务 


尽管 任 一 链 路 层 的 基本 服务 都 是 将 数据 报 通过 单一 通信 链 路 从 一 个 节点 移动 到 相 邻 节 
点 ， 但 所 提供 的 服务 细节 能 够 随 着 链 路 层 协议 的 不 同 而 变化 。 链 路 层 协 议 能 够 提供 的 可 能 
服务 包括 : 

e 成 帧 〈framing) 。 在 每 个 网 络 层 数据 报 经 链 路 传送 之 前 ， 几 乎 所 有 的 链 路 层 协 议 都 
要 将 其 用 链 路 层 帧 封装 起 来 。 一 个 帧 由 一 个 数据 字段 和 若干 首部 字段 组 成 ， 其 中 
网 络 层 数据 报 就 插 在 数据 字段 中 。 帧 的 结构 由 链 路 层 协 议 规定 。 当 我 们 在 本 章 的 
后 半 部 分 研究 具体 的 链 路 层 协议 时 ， 将 看 到 几 种 不 同 的 帧 格式 。 

© 链 路 接 入 。 媒 体 访问 控制 (Medium Access Control, MAC) 协议 规定 了 帧 在 链 路 上 
传输 的 规则 。 对 于 在 链 路 的 一 端 仅 有 一 个 发 送 方 、 链 路 的 另 一 端 仅 有 一 个 接收 方 
的 点 对 点 链 路 ，MAC 协议 比较 简单 〈 或 者 不 存在 ) ， 即 无 论 何 时 链 路 空闲 ， 发 送 
方 都 能 够 发 送 帧 。 更 有 趣 的 情况 是 当 多 个 节点 共享 单个 广播 链 路 时 ， 即 所 谓 多 路 
访问 问题 。 这 里 ，MAC 协议 用 于 协调 多 个 节点 的 帧 传输 。 

© 可 靠 交 付 。 当 链 路 层 协议 提供 可 靠 交 付 服务 时 ， 它 保证 无 差错 地 经 链 路 层 移 动 每 个 
网 络 层 数据 报 。 前 面 讲 过 ， 某 些 运 输 层 协议 〈 例 如 TCP) 也 提供 可 靠 交 付 服 务 。 与 
运输 层 可 靠 交 付 服务 类 似 ， 链 路 层 的 可 靠 交 付 服务 通常 是 通过 确认 和 重 传 取得 的 
(参见 3.4 节 )。 链 路 层 可 靠 交 付 服务 通常 用 于 易于 产生 高 差错 率 的 链 路 ， 例 如 无 线 
链 路 ， 其 目的 是 本 地 (也 就 是 在 差错 发 生 的 链 路 上 ) 纠正 一 个 差错 ， 而 不 是 通过 运 
输 层 或 应 用 层 协 议 迫 使 进行 端 到 端的 数据 重 传 。 然 而 ， 对 于 低 比 特 差错 的 链 路 ， 包 
括 光 纤 、 同 轴 电 缆 和 许多 双 绞 铜 线 链 路 ， 链 路 层 可 靠 交 付 可 能 会 被 认为 是 一 种 不 必 
要 的 开销 。 由 于 这 个 原因 ， 许 多 有 线 的 链 路 层 协议 不 提供 可 靠 交 付 服务 。 

e 差错 检测 和 纠正 。 当 帧 中 的 一 个 比特 作为 工 传输 时 ， 接 收 方 节点 中 的 链 路 层 硬件 
可 能 不 正确 地 将 其 判断 为 0， 反 之 亦 然 。 这 种 比特 差错 是 由 信和 号 衰减 和 电磁 噪声 导 
致 的 。 因 为 没有 必要 转发 一 个 有 差错 的 数据 报 ， 所 以 许多 链 路 层 协议 提供 一 种 机 
制 来 检测 这 样 的 比特 差错 。 通 过 让 发 送 节点 在 帧 中 包括 差错 检测 比特 ， 让 接收 节 
点 进行 差错 检查 ， 以 此 来 完成 这 项 工作 。 第 3 章 和 第 4 章 讲 过 ， 因 特 网 的 运输 层 
和 网 络 层 也 提供 了 有 限 形式 的 差错 检测 ， 即 因特网 检验 和 。 链 路 层 的 差错 检测 通 
常 更 复杂 ， 并 且 用 硬件 实现 。 差 错 纠正 类 似 于 差错 检测 ， 区 别 在 于 接收 方 不 仅 能 
检测 帧 中 出 现 的 比特 差错 ， 而 且 能 够 准确 地 确定 帧 中 的 差错 出 现 的 位 置 (并 因此 
纠正 这 些 差错 ) 。 


6.1.2 链 路 层 在 何 处 实现 


在 深入 学 习 链 路 层 的 细节 之 前 ， 本 概述 的 最 后 一 节 考虑 一 下 在 何 处 实现 链 路 层 的 问 
题 。 我 们 将 关注 一 个 端 系统 ， 因 为 我 们 在 第 4 章 中 知道 链 路 层 是 实现 在 路 由 器 的 线路 卡 中 
的 。 主 机 的 链 路 层 是 用 硬件 还 是 用 软件 实现 的 呢 ? 它 是 实现 在 一 块 单独 的 卡 上 还 是 一 个 芯 
片上 ? 它 是 怎样 与 主机 的 硬件 和 操作 系统 组 件 的 其 他 部 分 接口 的 呢 ? 

图 6-2 显示 了 一 个 典型 的 主机 体系 结构 。 链 路 层 的 主体 部 分 是 在 网 络 适 配器 (network 
adapter) 中 实现 的 ， 网 络 适配器 有 时 也 称 为 网 络 接 口 卡 (Network Interface Card, NIC), 
位 于 网 络 适 配器 核心 的 是 链 路 层 控制 器 ， 该 控制 器 通常 是 一 个 实现 了 许多 链 路 层 服务 (成 
Wi, 、 链 路 接 人 、 差 错 检测 等 ) 的 专用 芯片 。 因 此 ， 链 路 层 控制 器 的 许多 功能 是 用 硬件 实现 
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的 。 例 如 ，Intel 的 710 控制 器 [Intel 2016] 实现 了 以 太 网 协议 ， 我 们 将 在 6. 5 市 中 学 习 该 
协议 ; Atheros AR5006[ Atheros 2016] 控制 器 实现 了 802.11 WiFi 协议 ， 我 们 将 在 第 7 章 学 
习 该 协议 。 直 到 20 世纪 .90 年 代 后 期 ， 大 部 分 网 络 适配器 还 是 物理 上 分 离 的 卡 (如 一 块 
PCMCIA 卡 或 者 一 块 插 进 PC 的 PCI 卡 槽 中 的 插入 卡 )， 但 越 来 越 多 的 网 络 适 配器 被 综合 进 
主机 的 主板 ， 即 所 谓 的 局 域 网 在 主板 配置 。 

在 发 送 端 ， 控 制 器 取得 了 由 协议 栈 较 高 层 生成 并 存储 在 主机 内 存 中 的 数据 报 ， 在 链 路 
层 帧 中 封装 该 数据 报 (填写 该 帧 的 各 个 字段 )， 然 后 遵循 链 路 接 入 协议 将 该 帧 传 进 通信 和 链 
路 中 。 在 接收 端 ， 控 制 器 接收 了 整个 帧 ， 抽 取出 网 络 层 数据 报 。 如 果 链 路 层 执行 差错 检 
W, ， 则 需要 发 送 控制 器 在 该 帧 的 首部 设置 差错 检测 比特 ， 由 接收 控制 器 执行 差错 检测 。 

图 6-2 显示 了 与 主机 总 线 (例如 一 条 PCI 或 PCI-X BA) 连接 的 网 络 适 配器 ， 这 里 它 
看 起 来 非常 像 与 其 他 主机 组 件 连接 的 任何 其 主机 
他 IO 设备 。 图 6-2 还 显示 了 尽管 大 部 分 链 
路 层 是 在 硬件 中 实现 的 ， 但 部 分 链 路 层 是 在 
运行 于 主机 CPU 上 的 软件 中 实现 的 。 链 路 层 
的 软件 组 件 实现 了 高 层 链 路 层 功 能 ， 如 组 装 
链 路 层 寻 址 信息 和 激活 控制 器 硬件 。 在 接收 
端 ， 链 路 层 软件 响应 控制 器 中 断 〈 例 如 ， 由 
于 一 个 或 多 个 帧 的 到 达 ) ， 处 理 差错 条 件 和 
将 数据 报 向 上 传递 给 网 络 层 。 所 以 ， 链 路 层 
是 硬件 和 软件 的 结合 体 ， 即 此 处 是 协议 栈 中 
软件 与 硬件 交接 的 地 方 。 [ Intel 2016] 从 软 
件 缩 程 的 角度 提供 了 有 关 XL 710 PERAR AT “图 6-2 网 络 适配器 它 与 其 他 主机 组 件 及 
读 性 很 强 的 概述 (以 及 详细 的 描述 ) o 协议 栈 功能 的 关系 


6.2 差错 检测 和 纠正 技术 


在 上 一 节 中 ， 我们 提 到 了 比特 级 差错 检测 和 纠正 (bit-level error detection and correc- 
tion) ， 即 对 从 一 个 节点 发 送 到 另 一 个 物理 上 连接 的 邻近 节点 的 链 路 层 帧 中 的 比特 损伤 进行 
检测 和 纠正 ， 它 们 通常 是 链 路 层 提供 的 两 种 服务 。 我 们 在 第 3 章 中 看 到 差错 检测 和 纠正 服 
务 通常 也 由 运输 层 提供 。 在 本 节 中 ， 我 们 将 研究 几 种 最 简单 的 技术 ,它们 能 够 用 于 检测 比 
特 差 错 ， 而 且 在 某 些 情况 下 ， 能 够 纠正 这 样 的 比特 差错 。 对 该 主题 理论 和 实现 的 全 面 描述 
是 许多 教科 书 的 主题 (例如 [Schwartz 1980] 或 [Bertsekas 1991 ] ) ， 而 我 们 这 里 仅 讨论 
必要 内 容 。 我 们 此 时 的 目的 是 对 差错 检测 和 纠正 技术 提供 的 能 力 有 一 种 直观 的 认识 ， 并 看 
看 一 些 简单 技术 在 链 路 层 中 的 工作 原理 及 其 如 何 实际 应 用 。 

图 6-3 图 示 说 明了 我 们 研究 的 环境 。 在 发 送 节 点 ， 为 了 保护 比特 免 受 差错 ， 使 用 差错 
检测 和 纠正 比特 ( Error- Detection and- Correction, EDC) 来 增强 数据 D。 通 常 ， 要 保护 的 
数据 不 仅 包括 从 网 络 层 传递 下 来 需要 通过 链 路 传输 的 数据 报 ， 而 且 包 括 链 路 帧 首部 中 的 链 
路 级 的 寻 址 信息 、 序 号 和 其 他 字段 。 链 路 级 帧 中 的 D 和 EDC 都 被 发 送 到 接收 节点 。 在 接 
收 节点 ， 接 收 到 比特 序列 D' 和 EDC'。 注 意 到 因 传 输 中 的 比特 翻转 所 致 ，D' 和 EDC' 可 能 与 
初始 的 DD 和 EDC 不同 。 

接收 方 的 挑战 是 在 它 只 收 到 D' 和 EDC' 的 情况 下 ,确定 D' 是 否 和 初始 的 D 相同 。 在 


主机 总 线 
(例如 PCDD 


网 络 适配器 
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图 6-3 中 的 接收 方 判 定 的 准确 措辞 (我们 问 是 否 检测 到 一 个 差错 ， 而 非 是 否 出 现 了 差错 !1) 
是 重要 的 。 差 错 检测 和 纠正 技术 使 接收 方 有 时 但 并 总 是 检测 出 已 经 出 现 的 比特 差错 。 即 使 
采用 差错 检测 比特 ， 也 还 是 可 能 有 未 检 出 比特 差错 (undetected bit error); 这 就 是 说 ， 接 
收 方 可 能 无 法 知道 接收 的 信息 中 包含 着 比特 差错 。 因 此 ， 接 收 方 可 能 向 网 路 层 交 付 一 个 损 
伤 的 数据 报 ， 或 者 不 知道 该 帧 首部 的 某 个 其 他 字段 的 内 容 已 经 损伤 。 我 们 因此 要 选择 一 个 
差错 检测 方案 ,使 得 这 种 事件 发 生 的 概率 很 小 。 一 般 而 言 ， 差 错 检测 和 纠 错 技 术 越 复杂 
( 即 那些 具有 未 检测 出 比特 差错 概率 较 小 的 技术 ) ， 导 致 的 开销 就 越 大 ， 这 就 是 意味 着 需要 
更 多 的 计算 量 及 更 多 的 差错 检测 和 纠 错 比特 。 


| 






A, 


易 出 现 比特 差错 的 链 路 
图 6-3 差错 检测 与 纠正 的 场景 


” 我们 现在 来 研究 在 传输 数据 中 检测 差错 的 3 种 技术 : 奇偶 校 验 ( 它 用 来 描述 差错 检测 
和 纠正 背后 隐 含 的 基本 思想 ) 、 检 验 和 方法 ( 它 通常 更 多 地 应 用 于 运输 层 ) 和 循环 元 余 检 
测 ( 它 通常 更 多 地 应 用 在 适配器 中 的 链 路 层 ) 。 


6. 2. 1 奇偶 校 验 


也 许 差 错 检测 最 简单 的 方式 就 是 用 单个 奇偶 校 验 位 (parity bit) 。 假 设 在 图 6-4 中 要 发 
送 的 信息 DA d 比特 。 在 偶 校 验方 案 中 ， 发 送 方 只 需 





4 比特 数据 校 验 比 特 
包含 一 个 附加 的 比特 ， 选 择 它 的 值 ， 使 得 这 4d +1 比 Bik. 
竺 (初始 信息 加 上 一 个 校 验 比特 ) pinus M wollo ll 





数 。 对 于 奇 校 验 方案 ,选择 校 验 比特 值 使 得 有 奇数 个 i | 
1。 图 6-4 描述 了 一 个 偶 校 验 的 方案 ， 单 个 校 验 比特 被 图 6-4 1 比特 偶 校 验 
存放 在 一 个 单独 的 字段 中 。 

采用 单个 奇偶 校 验 位 方式 ， 接 收 方 的 操作 也 很 简单 。 接 收 方 只 需要 数 一 数 接收 的 d +1 
比特 中 1 的 数目 即 可 。 如 果 在 采用 侦 校 验方 案 中 发 现 了 奇数 个 值 为 1 的 比特 ， 接 收 方 知道 
至 少 出 现 了 一 个 比特 差错 。 更 精确 的 说 法 是 ， 出 现 了 奇数 个 比特 差错 。 

但 是 如 果 出 现 了 偶数 个 比特 差错 ， 那 会 发 生 什么 现象 呢 ? 你 应 该 认识 到 这 将 导致 一 个 
未 检 出 的 差错 。 如 果 比 特 差错 的 概率 小 ， 而 且 比 特 之 间 的 差错 可 以 被 看 作 是 独立 发 生 的 ， 
在 一 个 分 组 中 多 个 比特 同时 出 错 的 概率 将 是 极 小 的 。 在 这 种 情况 下 ， 单 个 奇偶 校 验 位 可 能 
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是 足够 的 了 。 然 而 ， 测 量 已 经 表明 了 差错 经 常 以 “ 突 发 ”方式 聚集 在 一 起 ， 而 不 是 独立 地 
发 生 。 在 突 发 差错 的 情况 下 ， 使 用 单 比 特 奇偶 校 验 保护 的 一 帧 中 未 检测 出 差错 的 概率 能 够 
达到 50% [Spragins 1991]。 显 然 , 需要 一 个 更 健壮 的 差错 检测 方案 (幸运 的 是 实践 中 正 
在 使 用 这 样 的 方式 !)。 但 是 在 研究 实践 中 使 用 的 差错 检测 方案 之 前 ,我 们 考虑 对 单 比特 奇 
偶 校 验 的 一 种 简单 一 般 化 方案 ， 这 将 使 我 们 深入 地 理解 纠 错 技术 。 

图 6-5 显示 了 单 比特 奇偶 校 验 方案 的 二 维 一 般 化 方案 。 这 里 D 中 的 d 个 比特 被 划分 为 i 
行列 。 对 每 行 和 每 列 计算 奇偶 值 。 产 生 的 行 校 验 
i+j+1 奇偶 比特 构成 了 链 路 层 帧 的 差错 检测 
比特 。 

现在 假设 在 初始 d 比特 信息 中 出 现 了 
单个 比特 差错 。 使 用 这 种 二 维 奇 偶 校 验 
(two-dimensional parity) 方案 ， 包 含 比 特 值 
改变 的 列 和 行 的 校 验 值 都 将 会 出 现 差错 。 
因此 接收 方 不 仅 可 以 检测 到 出 现 了 单个 比 
特 差错 的 事实 ,而且 还 可 以 利用 存在 奇偶 
校 验 差错 的 列 和 行 的 索引 来 实际 识别 发 生 
差错 的 比特 并 纠正 它 ! 图 6-5 显示 了 一 个 例 
子 ， 其 中 位 于 (2, 2) 的 值 为 1 的 比特 损 
坏 了 ， 变 成 了 0， 该 差错 就 是 一 个 在 接收 方 
可 检测 并 可 纠正 的 差错 。 尽 管 我 们 的 讨论 
是 针对 初始 d 比特 信息 的 , 但 校 验 比特 本 
身 的 单个 比特 差错 也 是 可 检测 和 可 纠正 的 。 nia 
二 维 奇 偶 校 验 也 能 够 检测 〈 但 不 能 纠正 !1) 图 6-5 二 维 偶 校 验 
一 个 分 组 中 两 个 比特 差错 的 任何 组 合 。 二 维 奇偶 校 验方 案 的 其 他 特性 将 在 本 章 后 面 的 习题 
中 进行 探讨 。 

接收 方 检测 和 纠正 差错 的 能 力 被 称 为 前 向 纠 错 (Forward Error Correction，FEC) 。 这 
些 技术 通常 用 于 如 音频 CD 这 样 的 音频 存储 和 回放 设备 中 。 在 网 络 环境 中 ，FEC 技术 可 以 
单独 应 用 ， 或 与 链 路 层 ARQ 技术 一 起 应 用 ，ARQ 技术 与 我 们 在 第 3 章 研 究 的 协议 类 似 。 
FEC 技术 很 有 价值 ， 因 为 它们 可 以 减少 所 需 的 发 送 方 重 发 的 次 数 。 也 许 更 为 重要 的 是 ， 它 
们 允许 在 接收 方 立即 纠正 差错 。FEC 避免 了 不 得 不 等 待 的 往返 时 延 ， 而 这 些 时 延 是 发 送 方 收 
到 NAK 分 组 并 向 接收 方 重 传 分 组 所 需要 的 ， 这 对 于 实时 网 络 应 用 [Rubenstein 1998] 或 者 具 
有 长 传播 时 延 的 链 路 (如 深 空 间 链 路 ) 可 能 是 一 种 非常 重要 的 优点 。 研 究 差错 控制 协议 中 
FEC 的 使 用 的 资料 包括 [Biersack 1992; Nonnenmacher 1998; Byers 1998; Shacham 1990 ] 。 


6.2.2 检验 和 方法 


在 检验 和 技术 中 ， 图 6-4 中 的 d 比特 数据 被 作为 一 个 比特 整数 的 序列 处 理 。 一 个 简 
单 检验 和 方法 就 是 将 这 上 比特 整数 加 起 来 ， 并且 用 得 到 的 和 作为 差错 检测 比特 。 因 特 网 检 
验 和 (Internet checksum) 就 基于 这 种 方法 ， 即 数据 的 字 节 作为 16 比特 的 整数 对 待 并 求 
和 。 这 个 和 的 反 码 形成 了 携带 在 报 文 段 首 部 的 因特网 检验 和 。 如 在 3. 3 节 讨 论 的 那样 ， 接 
收 方 通过 对 接收 的 数据 (包括 检验 和 ) 的 和 取 反 码 ， 并 且 检 测 其 结果 是 否 为 全 1 比特 来 检 
测 检验 和 。 如 果 这 些 比 特 中 有 任何 比特 是 0， 就 可 以 指示 出 差错 。RFC 1071 详细 地 讨论 因 
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特 网 检验 和 算法 和 它 的 实现 。 在 TCP 和 UDP 协议 中 ， 对 所 有 字段 (包括 首部 和 数据 字段 ) 
都 计算 因特网 检验 和 。 在 其 他 协议 中 ， 例 如 XTP [Strayer 1992], ， 对 首部 计算 一 个 检验 和 ， 
对 整个 分 组 计算 另 一 个 检验 和 。 

检验 和 方法 需要 相对 小 的 分 组 开销 。 例 如 ，TCP 和 UDP 中 的 检验 和 只 用 了 16 比特 。 
然而 ， 与 后 面 要 讨论 的 常用 于 链 路 层 的 CRC 相 比 ， 它 们 提供 相对 弱 的 差错 保护 。 这 时 ， 
一 个 很 自然 的 问题 是 : 为 什么 运输 层 使 用 检验 和 而 链 路 层 使 用 CRC WE? 前 面 讲 过 运输 层 
通常 是 在 主机 中 作为 用 户 操作 系统 的 一 部 分 用 软件 实现 的 。 因 为 运输 层 差 错 检测 用 软件 实 
M, 采用 简单 而 快速 如 检验 和 这 样 的 差错 检测 方案 是 重要 的 。 在 男 一 方面 ， 链 路 层 的 差错 
检测 在 适配器 中 用 专用 的 硬件 实现 ， 它 能 够 快速 执行 更 复杂 的 CRC 操作 。Feldmeier[ Feld- 
meier 1995] 描述 的 快速 软件 实现 技术 不 仅 可 用 于 加 权 检 验 和 编码 ， 而 且 可 用 于 CRC (I 
后 面 ) 和 其 他 编码 。 


6.2.3 循环 元 余 检 测 


现今 的 计算 机 网 络 中 广泛 应 用 的 差错 检测 技术 基于 循环 宛 余 检测 (Cyclic Redundancy 
Check, CRC) 编码 .CRC 编码 也 称 为 多 项 式 编码 (polynomial code) ， 因 为 该 编码 能 够 将 要 
发 送 的 比特 串 看 作为 系数 是 0 和 1 一 个 多 项 式 ， 对 比特 串 的 操作 被 解释 为 多 项 式 算术 。 
CRC 编码 操作 如 下 。 考 虑 d 比特 的 数据 D， 发 送 节点 要 将 它 发 送 给 接收 节点 。 发 送 方 
和 接收 方 首先 必须 协商 一 个 r++1 比特 模式 ， 称 为 生成 多 项 式 (generator) ， 我 们 将 其 表示 
HG, RIKER G 的 最 高 有 效 位 的 比特 (最 左边 ) 是 1。CRC 编码 的 关键 思想 如 图 6-6 
所 示 。 对 于 一 个 给 定 的 数据 段 D， 发 送 方 要 选择 7 个 附加 比特 R, erry 
使 得 得 到 的 d + r 比特 模式 (被 解释 为 一 4 比特 
个 二 进 制 数 ) 用 模 2 算术 恰好 能 被 6 整除 ee. 8 ee a 
( 即 没有 余数 ) 。 用 CRC 进行 差错 检测 的 过 ”| D: 被 发 送 的 数据 比特 上 [RS CRC 比 特 比特 模式 
程 因此 很 简单 : 接收 方 用 G 去 除 接收 到 的 Se seat R 数学 公式 
d+r 比特 。 如 果 余 数 为 非 零 ， 接 收 方 知道 
出 现 了 差错 ; 否则 认为 数据 正确 而 被 接收 。 
所 有 CRC 计算 采用 模 2 算术 来 做 ， 在 加 法 中 不 进位 ， 在 减法 中 不 借 位 。 这 意味 着 加 
法 和 减法 是 相同 的 ， 而 且 这 两 种 操作 等 价 于 操作 数 的 按 位 异 或 (XOR) 。 因 此 ， 举 例 来 说 : 
1011 XOR 0101 =1110 
1001 XOR 1101 =0100 


图 6-6 CRC 


类 似 地 ,- 我 们 还 会 有 : 
1011 ~ 0101 = 1110 
1001 - 1101 = 0100 
除了 所 需 的 加 法 或 减法 操作 没有 进位 或 借 位 外 ， 乘 法 和 除法 与 在 二 进 制 算术 中 是 相同 
的 。 如 在 通常 的 二 进 制 算术 中 那样 ， 乘 以 2 就 是 以 一 种 比特 模式 左 移 大 个 位 置 。 这 样 ， 给 
Æ D AIR, D+ 2'XOR R 产生 如 图 6-6 所 示 的 d+r 比特 模式 。 在 下 面 的 讨论 中 ， 我 们 将 利用 
图 6-6 中 这 种 d +r 比特 模式 的 代数 特性 。 
现在 我 们 回 到 发 送 方 怎样 计算 R 这 个 关键 问题 上 来 。 前 面 讲 过 ， 我 们 要 求 出 尺 使 得 对 
于 nn 有 : 
D -X XOR R = nG 
也 就 是 说 ， 我 们 要 选择 尽 使 得 G 能 够 除 以 D:2 XORRMRARM., MRR ER 
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等 式 的 两 边 都 用 只 异 或 〈 即 用 模 2 加 ， 而 没有 进位 ) ， 我 们 得 到 
D-+2' = nG XOR R 
这 个 等 式 告诉 我 们 ， 如 果 我 们 用 G 来 除 D* 2 ， 余 数值 刚好 是 R。 换 句 话 说， 我 们 可 
以 这 样 计算 R: 
Ch Ag 





R= remainder 2 


图 6-7 举例 说 明了 在 D=101110，d =6，G =1001 和 r =3 的 情况 下 的 计算 过 程 。 在 这 种 
情况 下 传输 的 9 个 比特 是 101110011。 你 应 该 自行 检查 一 下 G 
这 些 计算 ， 并 核对 一 下 也 . 2 = 101011 - G XOR R 的 确 一 一 L 
成 立 。 arora 

国际 标准 已 经 定义 了 8、12、16 和 32 比特 生成 多 项 式 
G。CRC-32 32 比特 的 标准 被 多 种 链 路 级 IEEE 协议 采用 ， 
使 用 的 一 个 生成 多 项 式 是 ; 

Gerca2 =100000100110000010001110110110111 

每 个 CRC 标准 都 能 检测 小 于 r+1 比特 的 突 发 差错 。 
(这 意味 着 所 有 连续 的 r 比特 或 者 更 少 的 差错 都 可 以 检测 
到 。) 此 外 , 在 适当 的 假设 下 ， 长 度 大 于 r+1l 比特 的 突 发 
差错 以 概率 1 -0.5" 被 检测 到 。 每 个 CRC 标准 也 都 能 检测 
任何 奇数 个 比特 差错 。 有 关 CRC 检测 实现 的 讨论 可 参见 
[ Williams 1993], CRC 编码 甚至 更 强 的 编码 所 依据 的 理论 
超出 了 本 书 的 范围 。 教 科 书 [Schwartz 1980] 对 这 个 主题 ”图 6-7 一 个 简单 的 CRC 计算 
提供 了 很 好 的 介绍 。 


6.3 多 路 访问 链 路 和 协议 


在 本 章 概述 中 ， 我 们 提 到 了 有 两 种 类 型 的 网 络 链 路 : 点 对 点 链 路 和 广播 链 路 。 点 对 点 
链 路 (point-to-point link) 由 链 路 一 端的 单个 发 送 方 和 链 路 另 一 端的 单个 接收 方 组 成 。 许 
多 链 路 层 协议 都 是 为 点 对 点 链 路 设计 的 ， 如 点 对 点 协议 (point-to-point protocol, PPP) 和 
高 级 数据 链 路 控制 (high-level data link control, HDLC) 就 是 两 种 这 样 的 协议 ， 我 们 将 在 
本 章 后 面 涉及 它们 。 第 二 种 类 型 的 链 路 是 广播 链 路 〈broadcast link) ， 它 能 够 让 多 个 发 送 
和 接收 节点 都 连接 到 相同 的 、 单 一 的 、 共 享 的 广播 信道 上 。 这 里 使 用 术语 “广播 ”是 因为 
当 任 何 一 个 节点 传输 一 个 帧 时 ， 信 道 广播 该 帧 ， 每 个 其 他 节点 都 收 到 一 个 副本 。 以 太 网 和 
无 线 局 域 网 是 广播 链 路 层 技术 的 例子 。 在 本 节 ， 我 们 暂缓 讨论 特定 的 链 路 层 协议 ， 而 先 研 
究 一 个 对 链 路 层 很 重要 的 问题 : 如 何 协 调 多 个 发 送 和 接收 节点 对 一 个 共享 广播 信道 的 访 
间 ， 这 就 是 多 路 访问 问题 (multiple access problem) 。 广 播 信道 通常 用 于 局 域 网 中 ， 局 域 网 
是 一 个 地 理 上 集中 在 一 座 建 筑 物 中 (或 者 在 一 个 公司 ,或 者 在 大 学 校园 ) 的 网 络 。 因 此 我 
们 还 将 在 本 节 后 面 考察 一 下 多 路 访问 信道 是 如 何在 局 域 网 中 使 用 的 。 

我 们 都 很 熟悉 广播 的 概念 ， 因 为 自 电 视 发 明 以 来 就 使 用 了 这 种 通信 方式 。 但 是 传统 的 
电视 是 一 种 一 个 方向 的 广播 〈 即 一 个 固定 的 节点 向 许多 接收 节点 传输 ) ， 而 计算 机 网 络 广 
播 信道 上 的 节点 既 能 够 发 送 也 能 够 接收 。 也 许 对 广播 信道 的 一 个 更 有 人 情 味 的 类 比 是 鸡 尾 
酒会 ， 在 那里 许多 人 聚集 在 一 个 大 房间 里 (空气 为 提供 广播 的 媒体 ) 谈论 和 倾听 。 第 二 个 
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切 题 的 类 比 是 许多 读者 都 很 熟悉 的 地 方 ， 即 一 间 教 室 ， 在 那里 老师 们 和 同学 们 同样 共享 相 
同 的 、 单 一 的 广播 媒体 。 在 这 两 种 场景 下 ， 一 个 中 心 问 题 是 确定 谁 以 及 在 什么 时 候 获得 说 
话 权 力 〈 也 就 是 向 信道 传输 ) 。 作 为 大 类 ， 为 了 共享 这 种 广播 信道 ， 我 们 已 经 演化 得 到 了 
一 个 精心 设计 的 协议 集 了 : 

“给 每 个 人 一 个 讲话 的 机 会 。 

“该 你 讲话 时 你 才 说 话 。” 

“不 要 一 个 人 独占 整个 谈话 。” 

“如 果 有 问题 请 举 手 。” 

“ 当 有 人 讲话 时 不 要 打 断 。” 

“ 当 其 他 人 讲话 时 不 要 睡觉 。 

计算 机 网 络 有 类 似 的 协议 ， 也 就 是 所 谓 的 多 路 访问 协议 (multiple access protocol), Bp 

节点 通过 这 些 协议 来 规范 它们 在 共享 的 广播 信道 上 的 传输 行为 。 如 图 6-8 所 示 ， 在 各 种 各 
样 的 网 络 环境 下 需要 多 路 访问 协议 ,包括 有 线 和 无 线 接 入 网 ， 以 及 卫星 网 络 。 尽 管 从 技术 
上 讲 每 个 节点 通过 它 的 适配器 访问 广播 信道 ， 但 在 本 节 中 我 们 将 把 节点 作为 发 送 和 接收 设 
备 。 在 实践 中 ， 数 以 百 计 或 者 甚至 数 以 千 计 个 节点 能 够 通过 一 个 广播 信道 直接 通信 。 


有 线 共享 无 线 共享 
(例如 电缆 接 入 网 ) (例如 WiFi) 


a! 





图 6-8 多 种 多 路 访问 信道 


因为 所 有 的 节点 都 能 够 传输 帧 ， 所 以 多 个 节点 可 能 会 同时 传输 帧 。 当 发 生 这 种 情况 
时 ， 所 有 节点 同时 接 到 多 个 帧 ; 这 就 是 说 ,传输 的 帧 在 所 有 的 接收 方 处 碰撞 (collide) 
了 。 通常， 当 碰 撞 发 生 时 ， 没 有 一 个 接收 节点 能 够 有 效 地 获得 任何 传输 的 帧 ;在 某 种 意义 
下 ， 碰 撞 帧 的 信号 纠缠 在 一 起 。 因 此 ， 涉 及 此 次 碰撞 的 所 有 帧 都 丢失 了 ， 在 碰撞 时 间 间 隔 
中 的 广播 信道 被 浪费 了 。 显 然 ， 如 果 许多 节点 要 频繁 地 传输 帧 ， 许 多 传输 将 导致 碰撞 ， 广 
播 信道 的 大 量 带 宽 将 被 浪费 掉 。 

当 多 个 节点 处 于 活跃 状态 时 ， 为 了 确保 广播 信道 执行 有 用 的 工作 ， 以 某 种 方式 协调 活 
跃 节点 的 传输 是 必要 的 。 这 种 协调 工作 由 多 路 访问 协议 负责 。 在 过 去 的 40 年 中 , 已 经 有 
上 千 篇 文 章 和 上 百 篇 博士 论文 研究 过 多 路 访问 协议 ; 有 关 这 部 分 工作 前 20 年 来 的 一 个 内 
容 丰富 的 综述 见 [Rom 1990 ] 。 此 外 ， 由 于 新 类 型 链 路 尤其 是 新 的 无 线 链 路 不 断 出 现 ， 在 
多 路 访问 协议 方面 研究 的 活跃 状况 仍 在 继续 。 
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这 些 年 来 ， 在 大 量 的 链 路 层 技术 中 已 经 实现 了 几 十 种 多 路 访问 协议 。 尽 管 如 此 ， 我 们 
能 够 将 任何 多 路 访问 协议 划分 为 3 种 类 型 之 一 : 信道 划分 协议 (channel partitioning proto- 
col) ， 随 机 接 入 协议 (random access protocol) 和 轮流 协议 (taking-turns protocol) 。 我 们 将 
在 后 续 的 3 个 小 节 中 讨论 这 几 类 多 路 访问 协议 。 

在 结束 概述 之 前 ， 我 们 给 出 下 列 条 件 。 在 理想 情况 下 ， 对 于 速率 为 R bps 的 广播 信 
道 ， 多 路 访问 协议 应 该 具有 以 下 所 希望 的 特性 : 

1) 当 仅 有 一 个 节点 发 送 数据 时 ， 该 节点 具有 R bps 的 吞吐 量 ; 

2) SAM 个 节点 发 送 数据 时 ， 每 个 节点 吞吐 量 为 RAM bps。 这 不 必要 求 M 个 节点 中 
的 每 一 个 节点 总 是 有 R/M 的 瞬间 速率 ， 而 是 每 个 节点 在 一 些 适当 定义 的 时 间 间 隔 内 应 该 
有 R/M 的 平均 传输 速率 。 

3) 协议 是 分 散 的 ; 这 就 是 说 不 会 因 某 主 节点 故障 而 使 整个 系统 崩溃 。 

4) 协议 是 简单 的 ， 使 实现 不 昂贵 。 


6.3.1 信道 划分 协议 


我 们 前 面 在 1.3 节 讨论 过 ， 时 分 多 路 复 用 (TDM) 和 频 分 多 路 复 用 (FDM) 是 两 种 
or 举例 来 说 ,假设 一 个 支持 入 
个 节点 的 信道 且 信 道 的 传输 速率 为 R 


bps, TDM 将 时 间 划 分 为 时 间 帧 (time «o M 
frame), JEHE— HRA ANTEA N 4S 

MERR (slot), 。 (不 应 当 把 TDM 时 间 帧 与 wy | 
在 发 送 和 接收 适配器 之 间 交 换 的 链 路 层 ?二 

数据 单元 相 混淆 ， 后 者 也 被 称 为 帧 。 为 
了 减少 混乱 ， 在 本 小 节 中 我 们 将 链 路 层 
交换 的 数据 单元 称 为 分 组 。) 然后 把 每 个 


时 隙 分 配给 N 个 节点 中 的 一 个 。 无 论 何 
时 某 个 节点 在 有 分 组 要 发 送 的 时 候 ， 它 





在 循环 的 TOM 帧 中 指派 给 它 的 时 隙 内 传 a ase > Soe 
ues les 

答 分 组 比特 。 通 常 ， 选 择 的 时 阶 长 度 应 he ge lat a 

使 一 个 时 阶 内 能 够 传输 单个 分 组 。 图 6-9 


表示 一 个 简单 的 4 个 节点 的 TDM 例子 。 图 6-9 一 个 4 节点 的 TDM 与 FDM 的 例子 
再 回 到 我 们 的 鸡尾酒 会 类 比 中 ， 一 个 采用 TDM 规则 的 鸡尾酒 会 将 允许 每 个 聚会 客人 在 固 
定 的 时 间 自 发言 ， 然 后 再 允许 另 一 个 聚会 客人 发 言 同样 时 长 ， 以 此 类 推 。 一 旦 每 个 人 都 有 
了 说 话机 会 ， 将 不 断 重复 着 这 种 模式 。 

TDM 是 有 吸引 力 的 ， 因 为 它 消除 了 碰撞 而 且 非 常 公平 : 每 个 节点 在 每 个 帧 时 间 内 得 
到 了 专用 的 传输 速率 RAN bps。 然 而 它 有 两 个 主要 缺陷 。 首 先 ， 节 点 被 限制 于 RAN bps 的 
平均 速率 ， 即 使 当 它 是 唯一 有 分 组 要 发 送 的 节点 时 。 其 次 ， 节 点 必须 总 是 等 待 它 在 传输 序 
列 中 的 轮 次 ， 即 我 们 再 次 看 到 ， 即 使 它 是 唯一 一 个 有 帧 要 发 送 的 节点 。 想 象 一 下 某 聚 会 客 
人 是 唯一 一 个 有 话 要 说 的 人 的 情形 〈 并 且 想 象 一 下 这 种 十 分 罕见 的 情况 ， 即 酒会 上 所 有 的 
人 都 想 听 某 一 个 人 说 话 ) 。 显 然 ， 一 种 多 路 访问 协议 用 于 这 个 特殊 聚会 时 ，TDM 是 一 种 很 
糟 的 选择 。 

TDM 在 时 间 上 共享 广播 信道 ， 而 FDM 将 R bps 信道 划分 为 不 同 的 频段 (每 个 频段 
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具有 R/N 带宽 ) ， 并 把 每 个 频率 分 配给 NN 个 节点 中 的 一 个 。 因 此 FDM 在 单个 较 大 的 R 
bps 信道 中 创建 了 X 个 较 小 的 RZN bps 信道 。FDM 也 有 TDM 同样 的 优点 和 缺点 。 它 避 
免 了 碰撞 ， 在 个 节点 之 间 公 平地 划分 了 带宽 。 然 而 ，FDM 也 有 TDM 所 具有 的 主要 缺 
点 ， 也 就 是 限制 一 个 节点 只 能 使 用 RAN 的 带宽 ， 即 使 当 它 是 唯一 一 个 有 分 组 要 发 送 的 
节点 时 。 

第 三 种 信道 划分 协议 是 码 分 多 址 (Code Division Multiple Access, CDMA), TDM 和 
FDM 分 别 为 节点 分 配 时 隙 和 频率 ， 而 CDMA 对 每 个 节点 分 配 一 种 不 同 的 编码 。 然 后 每 个 
节点 用 它 唯 一 的 编码 来 对 它 发 送 的 数据 进行 编码 。 如 果 精 心 选择 这 些 编码 ，CDMA 网 络 具 
有 一 种 奇妙 的 特性 ， 即 不 同 的 节点 能 够 同时 传输 ， 并 且 它 们 各 自 相 应 的 接收 方 仍 能 正确 接 
收发 送 方 编码 的 数据 比特 〈 假 设 接收 方 知道 发 送 方 的 编码 ) ， 而 不 在 乎 其 他 节点 的 干扰 传 
输 。CDMA 已 经 在 军用 系统 中 使 用 了 一 段 时 间 (由 于 它 的 抗 干 扰 特 性 )， 目 前 已 经 广泛 地 
用 于 民用 ， 尤 其 是 蜂窝 电话 中 。 因 为 CDMA 的 使 用 与 无 线 信道 紧密 相关 ， 所 以 我 们 将 把 有 
É CDMA 技术 细节 的 讨论 留 到 第 7 章 。 此 时 ， 我 们 知道 CDMA 编码 类 似 于 TDM 中 的 时 际 
Al FDM 中 的 频率 ， 能 分 配给 多 路 访问 信道 的 用 户 就 可 以 了 。 


6.3.2 随机 接 入 协议 


第 二 大 类 多 访问 协议 是 随机 接 人 和 人 协议。 在 随机 接 人 协议 中 ， 一 个 传输 节点 总 是 以 信 
道 的 全 部 速率 (ER bps) 进行 发 送 。 当 有 碰撞 时 ， 涉 及 碰撞 的 每 个 节点 反复 地 重 发 它 
的 帧 〈 也 就 是 分 组 ) ， 到 该 帧 无 碰撞 地 通过 为 止 。 但 是 当 一 个 节点 经 历 一 次 碰撞 时 ， 它 
不 必 立 刻 重 发 该 帧 。 相 反 ， 它 在 重 发 该 帧 之 前 等 待 一 个 随机 时 延 。 涉 及 碰撞 的 每 个 节点 
独立 地 选择 随机 时 延 。 因 为 该 随机 时 延 是 独立 地 选择 的 ， 所 以 下 述 现象 是 有 可 能 的 : 这 
些 节点 之 一 所 选择 的 时 延 充 分 小 于 其 他 碰撞 节点 的 时 延 ， 并 因此 能 够 无 磁 撞 地 将 它 的 帧 
在 信道 中 发 出 。 
-文献 中 描述 的 随机 接 人 协议 即使 没有 上 百 种 也 有 几 十 种 [Rom 1990; Bertsekas 
1991], 在 本 节 中 ,我 们 将 描述 一 些 最 常用 的 随机 接 入 协议 ， 即 ALOHA 协议 [Abramson 
1970; Abramson 1985; Abramson 2009] 和 载波 侦 听 多 路 访问 (CSMA) Py [Kleinrock 
1975b] 。 以 太 网 [Metcalfe 1976] 是 一 种 流行 并 广泛 部 署 的 CSMA 协议 。 

1， 时 险 ALOHA 


我 们 以 最 简单 的 随机 接 人 协议 之 一 一 时 隙 ALOHA 协议 ， 开 始 我 们 对 随机 接 人 协议 
的 学 习 。 在 对 时 际 ALOHA 的 描述 中 ， 我 们 做 下 列 假设 : 

。 HAWA L 比特 组 成 。 
时 间 被 划分 成 长 度 为 LAR BERET BR 〈 这 就 是 说 ， 一 个 时 隙 等 于 传输 一 帧 的 时 间 ) 。 
节点 只 在 时 隙 起 点 开始 传输 帧 。 
节点 是 同步 的 ， 每 个 节点 都 知道 时 隙 何 时 开始 。 
如 果 在 一 个 时 隙 中 有 两 个 或 者 更 多 个 帧 碰撞 ， 则 所 有 节点 在 该 时 隙 结束 之 前 检测 
到 该 碰撞 事件 。 

令 p 是 一 个 概率 ， 即 一 个 在 0 和 1 之 间 的 数 。 在 每 个 节点 中 ， 时 隙 ALOHA 的 操作 是 
简单 的 : 

© 当 节 点 有 一 个 新 帧 要 发 送 时 ， 它 等 到 下 一 个 时 隙 开始 并 在 该 时 隙 传输 整个 帧 。 

。 如 果 没有 碰撞 ， 该 节点 成 功 地 传输 它 的 帧 ， 从 而 不 需要 考虑 重 传 该 帧 。(〈 如果 该 节 
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点 有 新 帧 ， 它 能 够 为 传输 准备 一 个 新 帧 。) 
。 如 果 有 碰撞 ， 该 节点 在 时 际 结束 之 前 检测 到 这 次 碰撞 。 该 节点 以 概率 p 在 后 续 的 
每 个 时 隙 中 重 传 它 的 帧 ， 直 到 该 帧 被 无 碰撞 地 传输 出 去 。 

我 们 说 以 概率 p 重 传 ， 是 指 某 节 点 有 效 地 投掷 一 个 有 偏 倚 的 硬币 ; 硬币 正面 事件 对 
应 着 重 传 ， 而 重 传 出 现 的 概率 为 p。 硬 币 反面 事件 对 应 着 “ 跳 过 这 个 时 隙 ， 在 下 个 时 辽 
再 掷 硬币 ”; 这 个 事件 以 概率 (1 -p) 出 现 。 所 有 涉及 碰撞 的 节点 独立 地 投 指 它们 的 
硬币 。 

AY ALOHA 看 起 来 有 很 多 优点 。 与 信道 划分 不 同 ， 当 某 节点 是 唯一 活跃 的 节点 时 
(一 个 节点 如 果 有 帧 要 发 送 就 认为 它 是 活跃 的 ) ， 时 隙 ALOHA 允许 该 节点 以 全 速 尺 连 续 传 
输 。 时 阶 ALOHA 也 是 高 度 分 散 的 ， 因 为 每 个 节点 检测 碰撞 并 独立 地 决定 什么 时 候 重 传 。 
(Am, HBR ALOHA 的 确 需 要 在 节点 中 对 时 隙 同步 ; 我 们 很 快 将 讨论 ALOHA 协议 的 一 个 
不 分 时 隙 的 版 本 以 及 CSMA 协议 ， 这 两 种 协议 都 不 需要 这 种 同步 。) 时 隙 ALOHA 也 是 一 
个 极为 简单 的 协议 。 

当 只 有 一 个 活跃 节点 时 ， 时 隙 ALOHA 工作 出 色 , 但 是 当 有 多 个 活路 节点 时 效率 又 将 
如 何 呢 ? 这 里 有 两 个 可 能 要 考虑 的 效率 问题 。 首 先 ， 如 在 图 6-10 中 所 示 ， 当 有 多 个 活跃 
节点 时 ， 一 部 分 时 隙 将 有 碰撞 ， 因 此 将 被 “浪费 ” 掉 了 。 第 二 个 考虑 是 ， 时 隙 的 另 一 部 分 
将 是 空闲 的 ， 因 为 所 有 活跃 节点 由 于 概率 传输 策略 会 节制 传输 。 唯 一 “未 浪费 的 ”时 隙 是 
那些 刚好 有 一 个 节点 传输 的 时 隙 。 刚 好 有 一 个 节点 传输 的 时 隙 称 为 一 个 成 功 时 隙 ( suc- 
cessful slot) 。 时 际 多 路 访问 协议 的 效率 (efficiency) 定义 为 : 当 有 大 量 的 活跃 节点 且 每 个 
节点 总 有 大 量 的 帧 要 发 送 时 ， 长 期 运行 中 成 功 时 隙 的 份额 。 注 意 到 如 果 不 使 用 某 种 形式 的 
访问 控制 ， 而 且 每 个 节点 都 在 每 次 碰撞 之 后 立即 重 传 ， 这 个 效率 将 为 零 。 时 隙 ALOHA 显 
然 增加 了 它 的 效率 ， 使 之 大 于 零 ， 但 是 效率 增加 了 多 少 呢 ? 





和 时 间 
= 碰撞 时 隙 
E= 空 闲 时 隙 
S= 成 功 时 隙 


图 6-10 节点 1、2 和 3 在 第 一 个 时 隙 碰撞 。 节 点 2 最 终 在 第 4 个 时 隙 
成 功 ， 节 点 1 在 第 8 个 时 隙 成 功 ， 节 点 3 在 第 9 个 时 际 成功 


现在 我 们 继续 概要 讨论 时 际 ALOHA 最 大 效率 的 推导 过 程 。 为 了 保持 该 推导 简单 ， 我 
们 对 协议 做 了 一 点 修改 ,假设 每 个 节点 试图 在 每 个 时 隙 以 概率 p 传输 一 帧 。( 这 就 是 说 ， 
我 们 假设 每 个 节点 总 有 帧 要 发 送 ， 而 且 节 点 对 新 帧 和 已 经 经 历 一 次 碰撞 的 帧 都 以 概率 p 传 
输 。) 假设 及 个 节点 。 则 一 个 给 定时 隙 是 成 功 时 隙 的 概率 为 节点 之 一 传输 而 余下 的 NN -1 
个 节点 不 传输 的 概率 。 一 个 给 定 节点 传输 的 概率 是 ps 剩余 节点 不 传输 的 概率 是 (1 - 
P)”。 因 此 ， 一 个 给 定 节点 成 功 传送 的 概率 是 p(1 -p) 。 因 为 有 NN 个 节点 ,任意 一 个 
节点 成 功 传送 的 概率 是 Np(1 =p) 。 
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因此 ， 当 有 六 个 活跃 节点 时 ， 时 隙 ALOHA 的 效率 是 Np(1 - p) 。 为 了 获得 W 
个 活跃 节点 的 最 大 效率 ， 我 们 必须 求 出 使 这 个 表达 式 最 大 化 的 p”。( 对 这 个 推导 的 一 
个 大 体 描述 参见 课 后 习题 。) 而 且 对 于 大 量 活路 节点， 为 了 获得 最 大 效率 ， 当 NN 趋 于 
无 穷 时 ， 我们 取 Np’ (1 - p) 的 极限 。( 同样 参见 课 后 习题 ,) 在 完成 这 些 计 算 之 
后 ， 我 们 会 发 现 这 个 协议 的 最 大 效率 为 1/e =0.37。 这 就 是 说 ， 当 有 大 量 节点 有 很 多 
帧 要 传输 时 ， 则 (eA) MA 37% 的 时 隙 做 有 用 的 工作 。 因 此 该 信道 有 效 传输 速率 
不 是 尺 bps， 而 仅 为 0.37R bps! 相似 的 分 析 还 表明 37% 的 时 隙 是 空 闪 的 ，26% 的 时 
队 有 了 碰撞。 试想 一 个 整 脚 的 网 络 管理 员 购 买 了 一 个 100Mbps PY AY BRE ALOHA ASE, Ar 
望 能 够 使 用 网 络 在 大 量 的 用 户 之 间 以 总 计 速 率 如 80Mbps 来 传输 数据 。 尽 管 这 个 信道 
能 够 以 信道 的 全 速 100Mbps 传输 一 个 给 定 的 帧 ， 但 从 长 时 间 范 围 看 ， 该 信道 的 成 功 知 
吐 量 将 小 于 37Mbps。 

2. ALOHA 


时 隙 ALOHA 协议 要 求 所 有 的 节点 同步 它们 的 传输 ， 以 在 每 个 时 际 开 始 时 开始 传输 。 
第 一 个 ALOHA 协议 [ Abramson 1970] 实际 上 是 一 个 非 时 际 、 完 全 分 散 的 协议 。 在 纯 
ALOHA 中 ， 当 一 帧 首次 到 达 〈 即 一 个 网 络 层 数 据 报 在 发 送 节点 从 网 络 层 传递 下 来 ) ， 节 点 
立刻 将 该 帧 完整 地 传输 进 广 播 信 道 。 如 果 一 个 传输 的 帧 与 一 个 或 多 个 传输 经 历 了 碰撞 ， 这 
个 节点 将 立即 (在 完全 传输 完 它 的 碰撞 帧 之 后 ) 以 概率 p 重 传 该 帧 。 和 否则 ， 该 节点 等 待 一 
个 帧 传输 时 间 。 在 此 等 待 之 后 ， 它 则 以 概率 p 传输 该 帧 ， 或 者 以 概率 1 -p 在 另 一 个 帧 时 
间 等 待 〈 保 持 空闲 ) 。 

为 了 确定 纯 ALOHA 的 最 大 效率 ,我 们 关注 某 个 单独 的 节点 。 我 们 的 假设 与 在 时 院 
ALOHA 分 析 中 所 做 的 相同 ， 取 帆 传 输 时 间 为 时 间 单 元 。 在 任何 给 定时 间 ， 某 节点 传输 一 
个 帧 的 概率 是 ps。 假设 该 帧 在 时 刻 to 开始 传输 。 如 图 6-11 中 所 示 ， 为 了 使 该 帧 能 成 功 地 传 
输 ， 在 时 间 间 隔 [ia -1，5m] 中 不 能 有 其 他 节点 开始 传输 。 这 种 传输 将 与 节点 i 的 帧 传输 
起 始 部 分 相 重合 。 所 有 其 他 节点 在 这 个 时 间 间 隔 不 开始 传输 的 概率 是 (1 - p)” 。 类 似 
地 ， 当 节点 i 在 传输 时 ， 其 他 节点 不 能 开始 传输 ， 因 为 这 种 传输 将 与 节点 i 传输 的 后 面部 
分 相 重 春 。 所 有 其 他 节点 在 这 个 时 间 间 隔 不 开始 传输 的 概率 也 是 (1 - p) AE, 一 个 
给 定 的 节点 成 功 传输 一 次 的 概率 是 p(1 -pO 。 通 过 与 时 隙 ALOHA 情况 一 样 来 取 极 
限 ， 我 们 求 得 纯 ALOHA 协议 的 最 大 效率 仅 为 1M(2e) ， 这 刚好 是 时 隙 ALOHA 的 一 半 。 这 
就 是 完全 分 散 的 ALOHA 协议 所 要 付出 的 代价 。 


将 与 节点 i 的 将 与 节点 的 
帧 开始 部 分 重重 帧 结束 部 分 重 倒 
i, 





图 6-11 4h ALOHA 中 的 干扰 传输 
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Norm Abramson 和 ALOHAnet 


Norm Abramson 是 一 名 有 博士 学 位 的 工程 师 ， 对 冲浪 运动 很 有 激情 ， 而 且 对 分 组 交换 | 
很 感 兴趣 。 这 些 兴 趣 的 结合 使 他 在 1969 年 到 了 夏威夷 大 学 。 夏 威 夷 是 由 许多 巨大 的 岛屿 
组 成 的 ， 安 装 和 运营 基于 陆地 的 网 络 是 困难 的 。 当 不 冲浪 的 时 候 ，Abramson 思考 如 何 设计 
一 种 在 无 线 信 道上 完成 分 组 交互 的 网 络 。 他 设计 的 网 络 有 一 个 中 心 主 机 和 几 个 分 散在 夏 威 
夷 各 个 岛 上 的 二 级 节点 。 该 网 络 有 两 个 信道 ， 每 个 信道 使 用 不 同 的 频段 。 下 行 链 路 信道 从 
中 心 主机 向 二 级 主机 广播 分 组 ; 上 行 信 道 从 二 级 主机 人 向 中 心 主 机 发 送 分 组 。 除 了 发 送信 息 
分 组 ， 中 心 主机 还 在 下 行 信道 上 对 从 二 级 主机 成 功 接收 到 的 每 个 分 组 发 送 确认 。 

因为 二 级 主机 以 分 散 的 方式 传输 分 组 ， 在 上 行 信 道上 出 现 碰撞 是 不 可 避免 的 。 这 个 观 
察 导 致 Abramson 设计 了 如 本 章 所 描述 的 那 种 纯 ALOHA Hito Æ 1970 年 ， 通 过 不 断 从 
ARPA 获得 的 资助 ，Abramson 将 他 的 ALOHAnet 与 ARPAnet 相连 。Abramson 的 工作 是 很 重 
要 的 ， 不 仅 因为 它 是 无 线 分 组 网 络 的 第 一 个 例子 ， 而 且 因为 它 激励 了 Bob Metcalfe。 几 年 
Z, Metcalfe 修改 了 ALOHA 协议 ， 创 造 了 CSMA/CD 协议 和 以 太 网 局 域 网 。 | 


















3. 载波 侦 听 多 路 访问 (CSMA) 


在 时 际 和 纯 ALOHA 中 ， 一 个 节点 传输 的 决定 独立 于 连接 到 这 个 广播 信道 上 的 其 他 节 
点 的 活动 。 特 别 是 ， 一 个 节点 不 关心 在 它 开 始 传输 时 是 否 有 其 他 节点 碰巧 在 传输 ， 而 且 即 
使 有 另 一 个 节点 开始 干扰 它 的 传输 也 不 会 停止 传输 。 在 我 们 的 鸡尾酒 会 类 比 中 ，ALOHA 
协议 非常 像 一 个 粗野 的 聚会 客人 ， 他 喉 喉 不 休 地 讲话 而 不 顾 是 否 其 他 人 在 说 话 。 作 为 人 
类 ,我 们 有 人 类 的 协议 ， 它 要 求 我 们 不 仅 要 更 为 礼貌 ， 而 且 在 谈话 中 要 减少 与 他 人 “ 碰 
撞 ” 的 时 间 ， 从 而 增加 我 们 谈话 中 交流 的 数据 量 。 具 体 而 言 ， 有 礼貌 的 人 类 谈话 有 两 个 重 
要 的 规则 : 

e 说 话 之 前 先 听 。 如 果 其 他 人 正在 说 话 ， 等 到 他 们 说 完 话 为 止 。 在 网 络 领域 中 ， 这 

被 称 为 载波 侦 听 (carrier sensing) ， 即 一 个 节点 在 传输 前 先 听信 道 。 如 果 来 自 另 一 
个 节点 的 帧 正 向 信道 上 发 送 ， 节 点 则 等 待 直 到 检测 到 一 小 段 时 间 没 有 传输 ， 然 后 
开始 传输 。 

© 如 果 与 他 人 同时 开始 说 话 ， 停 止 说 话 。 在 网 络 领域 中 ， 这 被 称 为 碰撞 检测 (colli- 

sion detection) ， 即 当 一 个 传输 节点 在 传输 时 一 直 在 侦 听 此 信道 。 如 果 它 检测 到 另 
一 个 节点 正在 传输 干扰 帧 ， 它 就 停止 传输 ， 在 重复 “ 侦 听 - 当空 闲 时 传输 ”循环 
之 前 等 待 一 段 随机 时 间 。 

这 两 个 规则 包含 在 载波 侦 听 多 路 访问 (Carrier Sense Multiple Access, CSMA) 和 具有 
碰撞 检测 的 CSMA ( CSMA with Collision Detection, CSMA/CD) 协议 族 中 [Kleinrock 
1975b; Metcalfe 1976; Lam 1980; Rom 1990] 。 人 们 已 经 提出 了 CSMA 和 CSMA/CD 的 许 
多 变种 。 这 里 ,我 们 将 考虑 一 些 CSMA 和 CSMA/CD 最 重要 的 和 基本 的 特性 。 

关于 CSMA 你 可 能 要 问 的 第 一 个 问题 是 ， 如 果 所 有 的 节点 都 进行 载波 侦 听 了 ， 为 什么 
当初 会 发 生 碰撞 ? 毕竟 ， 某 节点 无 论 何 时 侦 听 到 另 一 个 节点 在 传输 ， 它 都 会 停止 传输 。 对 
于 这 个 问题 的 答案 最 好 能 够 用 时 空 图 来 说 明 [ Molle 1987]。 图 6-12 显示 了 连接 到 一 个 线 
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状 广播 总 线 的 4 个 节点 (A、B、C、D) 的 时 空 图 。 横 轴 表 示 每 个 节点 在 空间 的 位 置 ; 纵 
轴 表 示 时 间 。 

TENA ty ， 节 点 B 侦 听 到 信道 是 空闲 的 ， 因 为 当前 没有 其 他 节点 在 传输 。 因 此 节点 B 
开始 传输 ， 沿 着 广播 媒体 在 两 个 方向 上 传播 它 的 比特 。 图 6-12 中 B 的 比特 随 着 时 间 的 增 
加 向 下 传播 ， 这 表明 B 的 比特 沿 着 广播 媒体 传播 所 实际 需要 的 时 间 不 是 零 〈《 虽 然 以 接近 光 
的 速度 )。 在 时 刻 (h > to )， 节 点 DD 有 一 个 帧 要 发 送 。 尽 管 节点 B 在 时 刻 正在 传输 ， 
但 B 传 输 的 比特 还 没有 到 达 D， 因 此 D 在 4 个 听 到 信道 空闲 。 根据 CSMA 协议 ， 从 而 D FF 
始 传输 它 的 帧 。 一 个 短暂 的 时 间 之 后 ，B 的 传输 开始 在 D 干扰 D 的 传输 。 从 图 6-12 中 可 
以 看 出 ， 显 然 广播 信道 的 端 到 端 信道 传播 时 延 (channel propagation delay) (信号 从 一 个 节 
点 传播 到 另 一 个 节点 所 花费 的 时 间 ) 在 决定 其 性 能 方面 起 着 关键 的 作用 。 该 传播 时 延 越 
长 ， 载 波 侦 听 节点 不 能 侦 听 到 网 络 中 另 一 个 节点 已 经 开始 传输 的 机 会 就 越 大 。 

4. 具有 碰撞 检测 的 载波 侦 听 多 路 访问 (CSMA/CD) 

在 图 6-12 中 ， 节 点 没有 进行 碰撞 检测 ， 即 使 已 经 出 现 了 碰撞 ，B 和 D 都 将 继续 完整 
地 传输 它们 的 帧 。 当 某 节点 执行 碰撞 检测 时 ， 一 旦 它 检测 到 碰撞 将 立即 停止 传输 。 图 6-13 
表示 了 和 图 6-12 相同 的 情况 ， 只 是 这 两 个 节点 在 检测 到 碰撞 后 很 短 的 时 间 内 都 放弃 了 它 
们 的 传输 。 显 然 ， 在 多 路 访问 协议 中 加 入 碰撞 检测 ， 通 过 不 传输 一 个 无 用 的 、( 由 来 自 另 
一 个 节点 的 帧 干扰 ) 损坏 的 帧 ， 将 有 助 于 改善 协议 的 性 能 。 


空间 





时 间 时 间 sina 时 间 
6-12 发生 碰 撞 传输 的 两 个 CSMA 节点 的 时 空 图 图 6-13 具有 碰撞 检测 的 CSMA 

在 分 析 CSMA/CD 协议 之 前 ， 我 们 现在 从 与 广播 信道 相连 的 适配器 〈 在 节点 中 ) 的 角 
度 总 结 它 的 运行 : 

1) 适配器 从 网 络 层 一 条 获得 数据 报 ， 准 备 链 路 层 帧 ， 并 将 其 放 人 帧 适配器 缓存 中 。 

2) 如 果 适 配器 侦 听 到 信道 空闲 〈 即 无 信号 能 量 从 信道 进入 适配器 ) ， 它 开始 传输 帧 。 
在 另 一 方面 ， 如 果 适 配器 侦 听 到 信道 正在 忙 ， 它 将 等 待 ， 直 到 侦 听 到 没有 信和 号 能 量 时 才 开 
始 传 输 帧 。 

3) 在 传输 过 程 中 ， 适 配器 监视 来 自 其 他 使 用 该 广播 信道 的 适配器 的 信号 能 量 的 存在 。 








4) 如 果 适 配器 传输 整个 帧 而 未 检测 到 来 自 其 他 适 配 右 的 信号 能 量 ， 该 适 配 妖 就 完成 
了 该 帧 。 在 另 一 方面 ， 如 果 适 配器 在 传输 时 检测 到 来 自 其 他 适配器 的 信和 号 能 量 ， 它 中 止 传 
输 〈 即 它 停 止 了 传输 帧 ) 。 

5) 中 止 传输 后 ， 适 配器 等 待 一 个 随机 时 间 量 ， 然 后 返回 步骤 2。 

等 待 一 个 随机 (而 不 是 固定 ) 的 时 间 量 的 需求 是 明确 的 一 一 如 果 两 个 节点 同时 传输 
帧 ， 然 后 这 两 个 节点 等 待 相同 固定 的 时 间 量 ， 它 们 将 持续 碰撞 下 去 。 但 选择 随机 回 退 时 间 
的 时 间 间 隔 多 大 为 好 呢 ? 如 果 时 间 间 隔 大 而 碰撞 节点 数量 小 ， 在 重复 “ 侦 听 - 当空 闲 时 传 
输 ” 的 步骤 前 ， 节 点 很 可 能 等 待 较 长 的 时 间 (使 信道 保持 空闲 )。 在 男 一 方面 ， 如 果 时 间 
间隔 小 而 碰撞 节点 数量 大 ， 很 可 能 选择 的 随机 值 将 几乎 相同 ， 传 输 节 点 将 再 次 碰撞 。 我 们 
希望 时 间 间 隔 应 该 这 样 : 当 磁 撞 节 点 数量 较 少 时 ， 时 间 间 隔 较 短 ; 当 碰 撞 节 点 数量 较 大 
时 ， 时 间 间 隔 较 长 。 

用 于 以 太 网 以 及 DOCSIS 电缆 网 络 多 路 访问 协议 [DOCSIS 2011] 中 的 二 进 制 指数 后 
退 (binary exponential backoff) 算法 ， 简 练 地 解决 了 这 个 问题 。 特 别 是 ， 当 传输 一 个 给 定 
帧 时 ， 在 该 帧 经 历 了 一 连 串 的 次 碰撞 后 ， 节 点 随机 地 从 10, 1, 2, =, 2-1) 中 选择 
一 个 K 值 。 因 此 ， 一 个 帧 经 历 的 碰撞 越 多 ，K 选择 的 间隔 越 大 。 对 于 以 太 网 ， 一 个 节点 等 
待 的 实际 时 间 量 是 :512 比特 时 间 ( 即 发 送 512 比特 进入 以 太 网 所 需 时 间 量 的 玉 倍 ) ,nn 
能 够 取 的 最 大 值 在 10 以 内 。 

我 们 看 一 个 例子 。 假 设 一 个 适配器 首次 尝试 传输 一 个 帧 ， 并 在 传输 中 它 检 测 到 碰撞 。 
然后 该 节点 以 概率 0. 5 选择 下 =0， 以 概率 0. 5 选择 =1。 如 果 该 节点 选择 K=0， 则 它 立 
即 开 始 侦 听 信道 。 如 果 这 个 适配器 选择 到 =1， 它 在 开始 “ 侦 听 - 当空 闲 时 传输 ” 。 周 期 前 
等 待 512 比特 时 间 (例如 对 于 100Mbps 以 太 网 来 说 为 5. 12ms ) 。 在 第 2 次 碰撞 之 后 ， 从 
10, 1, 2, 3) 中 等 概率 地 选择 K, FE 3 次 碰撞 之 后 , 从 10, 1, 2, 3, 4, 5, 6, 7| 
中 等 概率 地 选择 KK。 在 10 次 或 更 多 次 碰撞 之 后 ， 从 10, 1, 2, =, 1023) 中 等 概率 地 选 
择 K。 因 此 从 中 选择 天 的 集合 长 度 随 着 碰撞 次 数 呈 指数 增长 ; 正 是 由 于 这 个 原因 ， 该 算法 
被 称 为 二 进 制 指数 后 退 。 

这 里 我 们 还 要 注意 到 ， 每 次 适配器 准备 传输 一 个 新 的 帧 时 ， 它 要 运行 CSMA/ED 算 
法 。 不 考虑 近期 过 去 的 时 间 内 可 能 已 经 发 生 的 任何 碰撞 。 因 此 ， 当 几 个 其 他 适配器 处 于 指 
数 后 退 状态 时 ， 有 可 能 一 个 具有 新 帧 的 节点 能 够 立刻 播 入 一 次 成 功 的 传输 。 

5. CSMA/CD 效率 


当 只 有 一 个 节点 有 一 个 帧 发 送 时 ， 该 节点 能 够 以 信道 全 速率 进行 传输 (例如 10Mbps、 
100Mbps 或 者 1Cbps) 。 然 而 ， 如 果 很 多 节点 都 有 帧 要 发 送 ， 信 道 的 有 效 传输 速率 可 能 会 小 
得 多 。 我 们 将 CSMA/CD 效率 (efficiency of CSMA/CD) 定义 为 : 当 有 大 量 的 活跃 节点 ， 
且 每 个 节点 有 大 量 的 帧 要 发 送 时 ， 帧 在 信道 中 无 碰撞 地 传输 的 那 部 分 时 间 在 长 期 运行 时 间 
中 所 占 的 份额 。 为 了 给 出 效率 的 一 个 闭 式 的 近似 表示 ， 令 di 表示 信和 号 能 量 在 任意 两 个 适 
配器 之 间 传 播 所 需 的 最 大 时 间 。 令 den 表示 传输 一 个 最 大 长 度 的 以 太 网 帧 的 时 间 (对 于 
10Mbps 的 以 太 网 ， 该 时 间 近 似 为 1.2 上 毫秒)。CSMA/CD 效率 的 推导 超出 了 本 书 的 范围 
(JL [Lam 1980] 和 [Bertsekas 1991])。 这 里 我 们 只 是 列 出 下 面 的 近似 式 : 

1 
E 5d... /d rans 


效率 = 
从 这 个 公式 我 们 看 到 ， 当 du 接近 0 时 ， 效 率 接近 1。 这 和 我 们 的 直觉 相符 ， 如 果 传 
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播 时 延 是 0， 磁 撞 的 节点 将 立即 中 止 而 不 会 浪费 信道 。 同 时 ， 当 di 变 得 很 大 时 ， 效 率 也 
接近 于 1。 这 也 和 直觉 相符 ， 因 为 当 一 个 帧 取得 了 信道 时 ， 它 将 占有 信道 很 长 时 间 ;， 因此 
信道 在 大 多 数 时 间 都 会 有 效 地 工作 。 


6. 3.3 轮流 协议 


前 面 讲 过 多 路 访问 协议 的 两 个 理想 特性 是 : 当 只 有 一 个 节点 活跃 时 ， 该 活跃 节点 具 
AR bps 的 吞吐 量 ; @@ 当 有 必 个 节点 活跃 时 ， 每 个 活跃 节点 的 吞吐 量 接 近 R/M bps。ALO- 
HA 和 CSMA 协议 具备 第 一 个 特性 ， 但 不 具备 第 二 个 特性 。 这 激发 研究 人 员 创 造 另 一 类 协 
议 ， 也 就 是 轮流 协议 (taking- turns protocol) 。 和 随机 接 人 协议 一 样 ， 有 几 十 种 轮流 协议 ， 
其 中 每 一 个 协议 又 都 有 很 多 变种 。 这 里 我 们 要 讨论 两 种 比较 重要 的 协议 。 第 一 种 是 轮 询 协 
议 (polling protocol) 。 轮 询 协议 要 求 这 些 节点 之 一 要 被 指定 为 主 节点 。 主 节点 以 循环 的 方 
式 轮 询 (poll) 每 个 节点 。 特 别 是 ， 主 节点 首先 向 节点 1 发 送 一 个 报 文 ， 告 诉 它 ( 节 点 1) 
能 够 传输 的 帧 的 最 多 数量 。 在 节点 1 传输 了 某 些 帧 后 ， 主 节点 告诉 节点 2 它 〈 节 点 2) 能 
够 传输 的 帧 的 最 多 数量 。( 主 节点 能 够 通过 观察 在 信道 上 是 否 缺 乏 信 上 号， 来 决定 一 个 节点 
何 时 完成 了 帧 的 发 送 。) 上 述 过 程 以 这 种 方式 继续 进行 ， 主 节点 以 循环 的 方式 轮 询 了 每 个 
Hiio 

SOT DUAR SPADE BLE A AREER, EE AAR E A 
但 是 它 也 有 一 些 缺 点 。 第 一 个 缺点 是 该 协议 引入 了 轮 询 时 延 ， 即 通知 一 个 节点 “ 它 可 以 传 
输 ” 所 需 的 时 间 。 例 如 ， 如 果 只 有 一 个 节点 是 活路 的 ， 那 么 这 个 节点 将 以 小 于 R bps 的 速 
率 传输 ， 因 为 每 次 活路 节点 发 送 了 它 最 多 数量 的 帧 时 ， 主 节点 必须 依次 轮 询 每 一 个 非 活 跃 
的 节点 。 第 二 个 缺点 可 能 更 为 严重 ， 就 是 如 果 主 节点 有 故障 ， 整 个 信道 都 变 得 不 可 操作 。 
我 们 在 本 节 学 习 的 802. 15 协议 和 蓝牙 协议 就 是 轮 询 协议 的 例子 。 

第 二 种 轮流 协议 是 令 牌 传递 协议 (token-passing protocol) 。 在 这 种 协议 中 没有 主 节 点 。 
一 个 称 为 令 牌 (token) 的 小 的 特殊 帧 在 节点 之 间 以 某 种 固定 的 次 序 进行 交换 。 例 如 ， 节 
点 1 可 能 总 是 把 令 牌 发 送 给 节点 2， 节 点 2 可 能 总 是 把 令 牌 发 送 给 节点 3， 而 节点 N 可 能 
总 是 把 令 牌 发 送 给 节点 1。 当 一 个 节点 收 到 令 牌 时 ， 仅 当 它 有 一 些 帧 要 发 送 时 ， 它 才 持 有 
这 个 令 牌 ; 否则 ， 它 立即 向 下 一 个 节点 转发 该 令 牌 。 当 一 个 节点 收 到 令 牌 时 ， 如 果 它 确实 
有 帧 要 传输 ， 它 发 送 最 大 数目 的 帧 数 ， 然 后 把 令 牌 转发 给 下 一 个 节点 。 令 牌 传递 是 分 散 
的 ， 并 有 很 高 的 效率 。 但 是 它 也 有 自己 的 一 些 问题 。 例 如 ， 一 个 节点 的 故障 可 能 会 使 整个 
信道 崩溃 。 或 者 如 果 一 个 节点 偶然 忘记 了 释放 令 牌 ， 则 必须 调用 某 些 恢复 步骤 使 令 牌 返回 
到 循环 中 来 。 经 过 多 年 ， 人 们 已 经 开发 了 许多 令 牌 传递 协议 ， 包 括 光 纤 分 布 式 数 据 接口 
(FDDI) 协 议 [Jain 1994] Fi IEEE 802.5 令 牌 环 协议 [IEEE 802.5 2012 ] ， 每 一 种 都 必须 解 
决 这 些 和 其 他 一 些 环 手 的 问题 。 


6.3.4 DOCSIS: 用 于 电缆 因特网 接 入 的 链 路 层 协议 


在 前 面 3 小 节 中 ， 我 们 已 经 学 习 了 3 大 类 多 路 访问 协议 : 信道 划分 协议 、 随 机 接 入 协 
议和 轮流 协议 。 这 里 的 电缆 接 人 网 将 作为 一 种 很 好 的 学 习 案 例 ， 因 为 在 电缆 接 人 网 中 我 们 
将 看 到 这 三 类 多 路 访问 协议 中 的 每 一 种 ! 

1.2.1 节 讲 过 ， 一 个 电缆 接 人 网 通常 在 电缆 网 头 端 将 几 千 个 住宅 电缆 调制 解 调 器 与 一 
个 电缆 调制 解 调 器 端 接 系 统 (Cable Modem Termination System, CMTS) 连接 。 数 据 经 电线 
服务 接口 (Data- Over- Cable Service Interface, CMTS) 规范 (DOCSIS) [ DOCSIS 2011] 定 
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义 了 电线 数据 网 络 体系 结构 及 其 协议 。D0OCSIS 使 用 FDM 将 下 行 (CMTS 到 调制 解 调 器 ) 
和 上 行 〈 调 制 解 调 器 到 CMTS) 网 络 段 划 分 为 多 个 频率 信道 。 每 个 下 行 信 道 宽 6MHz， 每 
个 信道 具有 大 约 40Mbps 吞吐 量 (尽管 这 种 数据 率 在 实践 中 很 少 在 电缆 调制 解 调 器 中 见 
到 ); 每 个 上 行 信道 具有 6.4MHz 的 最 大 信道 带宽 ,， 并且 最 大 的 上 行 否 吐 量 约 为 30Mbps。 
每 个 上 行 和 下 行 信道 均 为 广播 信道 。CMTS 在 下 行 信道 中 传输 的 帧 被 所 有 在 信道 上 做 接收 
的 电缆 调制 解 调 器 接收 到 ;然而 因为 仅 有 单一 的 CMTS 在 下 行 信道 上 传输 ， 不 存在 多 路 访 
问 问题 。 但 在 上 行 方向 ， 存 在 着 多 个 有 趣 的 技术 挑战 ， 因 为 多 个 电缆 调制 解 调 器 共享 到 
CMTS 的 相同 上 行 信道 (频率 ) ， 因 此 能 够 潜在 地 出 现 碰撞 。 

如 图 6-14 所 示 ， 每 条 上 行 信道 被 划分 为 时 间 间 隔 〈 类 似 于 TDM) ， 每 个 时 间 间 隔 包含 
一 个 微 时 隙 序列 ， 电 缆 调 制 解 调 器 可 在 该 微 时 隙 中 向 CMTS 传输 。CMTS 显 式 地 准许 各 个 
电缆 调制 解 调 器 在 特定 的 微 时 隙 中 进行 传输 。CMTS 在 下 行 信道 上 通过 发 送 称 为 MAP 报 文 
的 控制 报 文 ， 指 定 哪个 电缆 调制 解 调 器 ( 带 有 要 发 送 的 数据 ) 能 够 在 微 时 际 中 传输 由 控制 
报 文 指定 的 时 间 间 隔 。 由 于 微 时 隙 明确 分 配给 电缆 调制 解 调 器 ， 故 CMTS 能 够 确保 在 微 时 


际 中 没有 碰撞 传输 。 
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图 6-14 CMTS 和 电缆 调制 解 调 器 之 间 的 上 行 和 下 行 信道 


但 是 CMTS 一 开始 是 如 何 知 道 哪个 电缆 调制 解 调 器 有 数据 要 发 送 呢 ? 通过 让 电缆 调 
制 解 调 器 在 专用 于 此 目的 的 一 组 特殊 的 微 时 隙 间隔 内 向 CMTS 发 送 微 时 隙 请 求 帧 来 完成 
该 任务 ， 如 图 6-14 所 示 。 这 些微 时 隙 请 求 帧 以 随机 接 人 方式 传输 ， 故 可 能 相互 碰撞 。 
电缆 调制 解 调 器 既 不 能 侦 听 上 行 信道 是 否 忙 ， 也 不 能 检测 碰撞 。 相 反 ， 该 电缆 调制 解 调 
器 如 果 没 有 在 下 一 个 下 行 控制 报 文中 收 到 对 请 求 分 配 的 响应 的 话 ， 就 推断 出 它 的 微 时 隙 
请 求 帧 经 历 了 一 次 碰撞 。 当 推断 出 一 次 碰撞 ， 电 缆 调 制 解 调 器 使 用 二 进 制 指数 回 退 将 其 
微 时 隙 请 求 帧 延缓 到 以 后 的 时 隙 重新 发 送 。 当 在 上 行 信道 上 有 很 少 的 流量 ， 电 缆 调 制 解 
调 器 可 能 在 名 义 上 分 配给 微 时 隙 请 求 帧 的 时 隙 内 实际 传输 数据 帧 〈 因 此 避免 不 得 不 等 待 
微 时 隙 分 配 ) 。 

因此 ， 电 缆 接 入 网 可 作为 应 用 多 路 访问 协议 (EI FDM、TDM、 随 机 接 人 和 集中 分 配 
时 隙 都 用 于 一 个 网 络 中 ) 的 一 个 极 好 例子 。 


6.4 交换 局 域 网 
前 面 一 节 涉 及 了 广播 网 络 和 多 路 访问 协议 ， 我 们 现在 将 注意 力 转 向 交换 局 域 网 。 
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图 6-15 显示 了 一 个 交换 局 域 网 连接 了 3 个 部 门 ， 两 台 服 务 器 和 一 台 与 4 台 交 换 机 连接 的 
路 由 器 。 因 为 这 些 交 换 机 运行 在 链 路 层 ， 所 以 它们 交换 链 路 层 帧 〈 而 不 是 网 络 层 数据 报 )， 
不 识别 网 络 层 地 址 ， 不 使 用 如 RIP 或 OSPF 这 样 的 路 由 选择 算法 来 确定 通过 第 二 层 交 换 机 
网 络 的 路 径 。 我 们 马上 就 会 看 到 ， 它 们 使 用 链 路 层 地 址 而 不 是 IP 地 址 来 转发 链 路 层 帧 通 
过 交换 机 网 络 。 我 们 首先 以 讨论 链 路 层 寻 址 (6.4.1 节 ) 来 开始 对 交换 机 局 域 网 的 学 习 。 
然后 仔细 学 习 著 名 的 以 太 网 协议 (6.4.2 节 )。 在 仔细 学 习 链 路 层 寻 址 和 以 太 网 后 ,我 们 
将 考察 链 路 层 交 换 机 的 工作 方式 (6.4.3 节 )， 并 随后 考察 通常 是 如 何 用 这 些 交 换 机 构建 
大 规模 局 域 网 的 (6. 4.4 47) 
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电气 工程 系 计算 机 科学 系 计算 机 工程 系 
图 6-15 由 4 台 交换 机 连接 起 来 的 某 机 构 网 络 


6.4.1 链 路 层 寻 址 和 ARP 


主机 和 路 由 器 具有 链 路 层 地 址 。 现 在 你 也 许 会 感到 惊讶 ， 第 4 章 中 不 是 讲 过 主机 和 路 
由 器 也 具有 网 络 层 地 址 吗 ? 你 也 许 会 问 : 为 什么 我 们 在 网 络 层 和 链 路 层 都 需要 地 址 呢 ? 除 
了 描述 链 路 层 地 址 的 语法 和 功能 ， 在 本 节 中 我 们 希望 明明 白白 地 搞 清楚 两 层 地 址 都 有 用 的 
原因 ， 事 实 上 这 些 地 址 是 必 不 可 少 的 。 我 们 还 将 学 习 地 址 解析 协议 (ARP) ， 该 协议 提供 
了 将 IP 地 址 转换 为 链 路 层 地 址 的 机 制 。 

1. MAC 地 址 


事实 上 ， 并 不 是 主机 或 路 由 器 具有 链 路 层 地 址 ， 而 是 它们 的 适配器 〈 即 网 络 接口 ) A 
有 链 路 层 地 址 。 因 此 ， 具 有 多 个 网 络 接口 的 主机 或 路 由 器 将 具有 与 之 相关 联 的 多 个 链 路 层 
地 址 ， 就 像 它 也 具有 与 之 相关 联 的 多 个 IP 地 址 一 样 。 然 而 ， 重 要 的 是 注意 到 链 路 层 交 换 
机 并 不 具有 与 它们 的 接口 (这 些 接口 是 与 主机 和 路 由 器 相连 的 ) 相关 联 的 链 路 层 地 址 。 这 
是 因为 链 路 层 交 换 机 的 任务 是 在 主机 与 路 由 器 之 间 承 载 数据 报 ; 交换 机 透明 地 执行 该 项 任 
务 ， 这 就 是 说 ， 主 机 或 路 由 器 不 必 明 确 地 将 帧 寻 址 到 其 间 的 交换 机 。 图 6-16 中 说 明了 这 
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种 情况 。 链 路 层 地 址 有 各 种 不 同 的 称呼 : LAN Hik (LAN address) 、 物 理 地 址 (physical 
address) 或 MAC 地 址 (MAC address) 。 因 为 MAC 地 址 似乎 是 最 为 流行 的 术语 ， 所 以 我 们 
此 后 就 将 链 路 层 地 址 称 为 MAC 地 址 。 对 于 大 多 数 局 域 网 (包括 以 太 网 和 802. 11 无 线 局 域 
网 ) 而 言 ，MAC 地 址 长 度 为 6 字 节 ， 共 有 2” 个 可 能 的 MAC 地址 。 如 图 6-16 所 示 ， 这 些 6 
个 字 节 地 址 通常 用 十 六 进 制 表 示 法 ， 地 址 的 每 个 字 节 被 表示 为 一 对 十 六 进 制 数 。 尽 管 
MAC 地 址 被 设计 为 永久 的 ， 但 用 软件 改变 一 块 适配器 的 MAC 地 址 现在 是 可 能 的 。 然 而 ， 
对 于 本 节 的 后 面部 分 而 言 ， 我 们 将 假设 某 适配器 的 1A-23-F9-CD-06-9B 

MAC 地 址 是 固定 的 。 

MAC 地 址 的 一 个 有 趣 性 质 是 没有 两 块 适配器 具有 
相同 的 地 址 。 考 虑 到 适配器 是 由 许多 不 同 国家 和 地 区 
的 不 同 公司 生产 的 ， 这 看 起 来 似乎 是 件 神 奇 之 事 。 中 
国 台湾 生产 适配器 的 公司 如 何 能 够 保证 与 比利时 生产 
适配器 的 公司 使 用 不 同 的 地 址 呢 ? 答案 是 IEEE 在 管 
理 着 该 MAC 地 址 空间 。 特 别 是 ， 当 一 个 公司 要 生产 
适配器 时 ， 它 支付 象征 性 的 费用 购买 组 成 2 个 地 址 的 
一 块 地 址 空间 。IEEE 分 配 这 块 2 个 地 址 的 方式 是 : 
固定 一 个 MAC 地 址 的 前 24 比特 ， 让 公司 自己 为 每 个 二 
适配器 生成 后 24 比特 的 唯一 组 合 。 | 图 6-16 pa ne 

适配器 的 MAC 地 址 具有 扁平 结构 (这 与 层次 
结构 相反 )， 而 且 不 论 适配器 到 哪里 用 都 不 会 变化 。 带 有 以 太 网 接口 的 便携 机 总 具有 同 
样 的 MAC 地址， 无 论 该 计算 机 位 于 何方 。 具 有 802. 11 接口 的 一 台 智 能 手机 总 是 具有 相 
同 的 MAC 地 址 ， 无 论 该 智能 手机 到 哪里 。 与 之 形成 对 照 的 是 ， 前 面 说 过 的 P 地 址 具有 
层次 结构 〈 即 一 个 网 络 部 分 和 一 个 主机 部 分 ) ， 而 且 当 主机 移动 时 ， 主 机 的 IP 地 址 需要 
改变 ， 即 改变 它 所 连接 到 的 网 络 。 适 配器 的 MAC 地 址 与 人 的 社会 保险 号 相似 ， 后 者 也 
具有 扁平 寻 址 结构 ， 而 且 无 论 人 到 哪里 该 号 码 都 不 会 变化 。IP 地址 则 与 一 个 人 的 邮政 地 
址 相似 ， 它 是 有 层次 的 ， 无 论 何 时 当 人 搬家 时 ， 该 地 址 都 必须 改变 。 就 像 一 个 人 可 能 发 
现 邮政 地 址 和 社会 保险 号 都 有 用 那样 ， 一 台 主 机 具有 一 个 网 络 层 地 址 和 一 个 MAC 地 址 
是 有 用 的 。 

当 某 适配器 要 向 某 些 目的 适配器 发 送 一 个 帧 时 ， 发 送 适 配器 将 目的 适配器 的 MAC 地 
址 插入 到 该 帧 中 ， 并 将 该 帧 发 送 到 局 域 网 上 。 如 我 们 马上 要 看 到 的 那样 ， 一 台 交 换 机 偶尔 
将 一 个 人 帧 广播 到 它 的 所 有 接口 。 我 们 将 在 第 7 章 中 看 到 802. 11 也 广播 帧 。 因 此 一 块 适 
配器 可 以 接收 一 个 并 非 向 它 寻 址 的 帧 。 这 样 ， 当 适配器 接收 到 一 个 帧 时 ， 将 检查 该 帧 中 的 
目的 MAC 地 址 是 否 与 它 自己 的 MAC 地 址 匹配 。 如 果 匹 配 ， 该 适配器 提取 出 封装 的 数据 
报 ， 并 将 该 数据 报 沿 协议 栈 向 上 传递 。 如 果 不 匹配 ， 该 适配器 丢弃 该 帧 ， 而 不 会 向 上 传递 
该 网 络 层 数 据 报 。 所 以 ， 仅 当 收 到 该 帧 时 ， 才 会 中 断 目的 地 。 

然而 ， 有 时 某 发 送 适配器 的 确 要 让 局 域 网 上 所 有 其 他 适配器 来 接收 并 处 理 它 打算 发 送 
的 帧 。 在 这 种 情况 下 ， 发 送 适配器 在 该 帧 的 目的 地 址 字段 中 插入 一 个 特殊 的 MAC 广播 地 
dit (broadcast address) 。 对 于 使 用 6 字 节 地 址 的 局 域 网 (例如 以 太 网 和 802. 11) 来 说 ， 广 
播 地 址 是 48 个 连续 的 1 组 成 的 字符 串 〈 即 以 十 六 进 制 表示 法 表示 的 FF- FF- FF- FF- FF- 
FF), 
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保持 各 层 独 立 


| 主机 和 路 由 器 接口 除了 网 络 层 地 址 之 外 还 有 MAC 地 址 ， 这 有 如 下 几 个 原因 。 首 先 ， 
| 局 域 网 是 为 任意 网 络 层 协议 而 设计 的 ， 而 不 只 是 用 于 于 和 因特网 。 如 果 适 配器 被 指派 
IP 地 址 而 不 是 “中 性 的 ”MAC 地 址 的 话 ， 则 适配器 将 不 能 够 方便 地 支持 其 他 网 络 层 协 
I (例如 ，IPX 或 者 DECnet)。 其 次 ， 如 果 适 配器 使 用 网 络 层 地 址 而 不 是 MAC 地 址 的 
话 ， 网 络 层 地 址 必须 存储 在 适配器 的 RAM 中 ， 并 且 在 每 次 适配器 移动 (或 加 电 ) 时 要 
重新 配置 。 另 一 种 选择 是 在 适配器 中 不 使 用 任何 地 址 ， 让 每 个 适配器 将 它 收 到 的 每 帧 数 
据 (通常 是 卫 数据 报 ) 沿 协 议 栈 向 上 传递 。 然 后 网 络 层 则 能 够 核对 网 络 地 址 层 是 否 匹 
配 。 这 种 选择 带 来 的 一 个 问题 是 ， 主 机 将 被 局 域 网 上 发 送 的 每 个 帧 中 断 ， 包 括 被 目的 地 
是 在 相同 广播 局 域 网 上 的 其 他 节点 的 帧 中 断 。 总 之 ， 为 了 使 网 络 体系 结构 中 各 层次 成 为 
极为 独立 的 构建 模块 ， 不 同 的 层次 需要 有 它们 自己 的 寻 址 方案 。 我 们 现在 已 经 看 到 3 种 
类 型 的 地 址 ; 应 用 层 的 主机 和 名、 网 络 层 的 卫 地 址 以 及 链 路 层 的 MAC 地 址 。 





2. 地 址 解析 协议 


因为 存在 网 络 层 地 址 〈 人 例如， 因特网 的 IP 地 址 ) 和 链 路 层 地 址 ( 即 MAC 地 址 ) Ar 
以 需要 在 它们 之 间 进 行 转换 。 对 于 因特网 而 言 ， 这 是 地 址 解析 协议 (Address Resolution 
Protocol, ARP){ RFC 826] 的 任务 。 

为 了 理解 对 于 诸如 ARP 这 样 协议 的 需求 ， 考 虑 如 图 6-17 所 示 的 网 络 。 在 这 个 简单 的 
例子 中 ， 每 台 主 机 和 路 由 器 有 一 个 单一 的 卫 地 址 和 单一 的 MAC 地 址 。 与 以 往 一 样 ，IP 地 
址 以 点 分 十 进 制 表示 法 表示 ，MAC 地 址 以 十 六 进 制 表示 法 表示 。 为 了 便于 讨论 ， 我 们 在 
本 节 中 将 假设 交换 机 广播 所 有 帧 ; 这 就 是 说 ， 无 论 何 时 交换 机 在 一 个 接口 接收 一 个 帧 ， 它 
将 在 其 所 有 其 他 接口 上 转发 该 帧 。 在 下 一 节 中 ,我 们 将 更 为 准确 地 解释 交换 机 操作 的 
过 程 。 
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图 6-17 Jeg SRP) FEET ABA IP 地 址 和 一 个 MAC 地 址 
现在 假设 IP 地 址 为 222. 222. 222. 220 的 主机 要 向 主机 222. 222. 222. 222 发 送 IP 数据 
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报 。 在 本 例 中 ， 源 和 目的 均 位 于 相同 的 子 网 中 〈 在 4. 3.3 节 中 的 寻 址 意义 下 ) HTZ 
数据 报 , 该 源 必 须要 向 它 的 适配器 不 仅 提供 P 数据 报 , 而 且 要 提供 目的 主机 
222. 222. 222. 222 的 MAC 地 址 。 然 后 发 送 适 配器 将 构造 一 个 包含 目的 地 的 MAC 地 址 的 链 
路 层 帧 ， 并 把 该 帧 发 送 进 局 域 网 。 

在 本 节 中 要 处 理 的 重要 问题 是 ， 发 送 主机 如 何 确 定 IP 地 址 为 222. 222. 222. 222 的 目的 
主机 的 MAC 地 址 呢 ? 正如 你 也 许 已 经 猜想 的 那样 ， 它 使 用 ARP。 在 发 送 主机 中 的 ARP 模 
块 将 取 在 相同 局 域 网 上 的 任何 IP 地 址 作为 输入 ， 然 后 返回 相应 的 MAC 地 址 。 在 眼下 的 这 
个 例子 中 ， 发 送 主机 222. 222. 222. 220 向 它 的 ARP 模块 提供 了 IP 地 址 222. 222. 222. 222, 
并 且 其 ARP 模块 返回 了 相应 的 MAC 地 址 49-BD-D2-C7-56-2A。 

因此 我 们 看 到 了 ARP 将 一 个 IP 地 址 解析 为 一 个 MAC 地 址 。 在 很 多 方面 它 和 DNS 
(在 2.4 节 中 学 习 过 ) AW, DNS 将 主机 名 解析 为 IP 地 址 。 然 而 ， 这 两 种 解析 器 之 间 的 一 
个 重要 区 别 是 ，DNS 为 在 因特网 中 任何 地 方 的 主机 解析 主机 名 ， 而 ARP 只 为 在 同一 个 子 
网 上 的 主机 和 路 由 器 接口 解析 IP 地 址 。 如 果 美 国 加 利 福 尼 亚 州 的 一 个 节点 试图 用 ARP 为 
美国 密西西比 州 的 一 个 节点 解析 卫 地 址 ，ARP 将 返回 一 个 错误 。 

既然 已 经 解释 了 ARP 的 用 途 ， 我 们 再 来 看 看 它 是 如 何 工作 的 。 每 台 主 机 或 路 由 器 在 
其 内 存 中 具有 一 个 ARP R (ARP table) ， 这 张 表 包 含 IP 地 址 到 MAC 地 址 的 映射 关系 。 
图 6-18 显示 了 在 主机 222. 222. 222. 220 中 可 能 看 到 的 ARP 表 中 的 内 容 。 该 ARP 表 也 包含 
一 个 寿命 (TTL) 值 ， 它 指示 了 从 表 中 删除 每 个 映射 的 时 间 。 注 意 到 这 张 表 不 必 为 该 子 网 
上 的 每 台 主 机 和 路 由 器 都 包含 一 个 表 项 ; 某 些 可 能 从 来 没有 进入 到 该 表 中 ， 某 些 可 能 已 经 
过 期 。 从 一 个 表 项 放置 到 某 ARP 表 中 开始 ， 一 个 表 项 通常 的 过 期 时 间 是 20 分 钟 。 
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图 6-18 在 主机 222. 222. 222. 220 中 的 一 个 可 能 的 ARP 表 


现在 假设 主机 222. 222. 222. 220 要 发 送 一 个 数据 报 ， 该 数据 报 要 P 寻 址 到 本 子 网 上 另 
一 台 主 机 或 路 由 器 。 发 送 主机 需要 获得 给 定 卫 地 址 的 目的 主机 的 MAC 地 址 。 如 果 发 送 方 
的 ARP 表 具 有 该 目的 节点 的 表 项 ， 这 个 任务 是 很 容易 完成 的 。 但 如 果 ARP 表 中 当前 没有 
该 目的 主机 的 表 项 ， 又 该 怎么 办 呢 ? 特别 是 假设 222. 222. 222. 220 要 向 222. 222. 222. 222 
发 送 数据 报 。 在 这 种 情况 下 ， 发 送 方 用 ARP 协议 来 解析 这 个 地 址 。 首 先 ， 发 送 方 构造 一 
个 称 为 ARP 分 组 (ARP packet) 的 特殊 分 组 。 一 个 ARP 分 组 有 几 个 字段 ， 包 括 发 送 和 接 
收 了 下 地址 及 MAC 地 址 。ARP 查询 分 组 和 响应 分 组 都 具有 相同 的 格式 。ARP 查询 分 组 的 目 
的 是 询问 子 网 上 所 有 其 他 主机 和 路 由 器 ， 以 确定 对 应 于 要 解析 的 P 地 址 的 那个 MAC 
地 址 。 

回 到 我 们 的 例子 上 来 ，222. 222. 222. 220 向 它 的 适配器 传递 一 个 ARP 查询 分 组 ， 并 且 
指示 适配器 应 该 用 MAC 广播 地 址 (BE) FF-FF-FF-FF-FF-FF) 来 发 送 这 个 分 组 。 适 配器 在 
链 路 层 帧 中 封装 这 个 ARP 分 组 ， 用 广播 地 址 作为 帧 的 目的 地 址 ， 并 将 该 帧 传输 进 子 网 中 。 
回想 我 们 的 社会 保险 号 /邮政 地 址 的 类 比 ， 一 次 ARP 查询 等 价 于 一 个 人 在 某 公司 (比方 说 
AnyCorp) 一 个 拥挤 的 房间 大 喊 :“ 邮政 地 址 是 加 利 福 尼 亚 州 帕 罗 奥 图 市 AnyCorp 公司 112 
房间 13 室 的 那个 人 的 社会 保险 号 是 什么 ?” 包 含 该 ARP 查询 的 帧 能 被 子 网 上 的 所 有 其 他 
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适配器 接收 到 ， 并 且 (由 于 广播 地 址 ) 每 个 适配器 都 把 在 该 帧 中 的 ARP 分 组 向 上 传递 给 
ARP 模块 。 这 些 ARP 模块 中 的 每 个 都 检查 它 的 IP 地 址 是 否 与 ARP 分 组 中 的 目的 IP 地 址 
相 匹 配 。 与 之 匹配 的 一 个 给 查询 主机 发 送 回 一 个 带 有 所 和 希望 映射 的 响应 ARP 分 组 。 然 后 
查询 主机 222. 222. 222. 220 能 够 更 新 它 的 ARP 表 ， 并 发 送 它 的 IP 数据 报 ， 该 数据 报 封装 
在 一 个 链 路 层 帧 中 ， 并 且 该 帧 的 目的 MAC 就 是 对 先前 ARP 请 求 进行 响应 的 主机 或 路 由 器 
的 MAC 地 址 。 

关于 ARP 协议 有 两 件 有 趣 的 事情 需要 注意 。 首 先 ， 查 询 ARP 报 文 是 在 广播 帧 中 发 送 
的 ， 而 响应 ARP 报 文 在 一 个 标准 帧 中 发 送 。 在 继续 阅读 之 前 ， 你 应 该 思考 一 下 为 什么 这 
样 。 其 次 ，ARP 是 即 插 即 用 的 ， 这 就 是 说 ,一 个 ARP 表 是 自动 建立 的 ， 即 它 不 需要 系统 
管理 员 来 配置 。 并 且 如 果 某 主机 与 子 网 断 开 连接 ， 它 的 表 项 最 终 会 从 留 在 子 网 中 的 节点 的 
表 中 删除 掉 。 

学 生 们 常常 想 知道 ARP 是 一 个 链 路 层 协议 还 是 一 个 网 络 层 协 议 。 如 我 们 所 看 到 的 那 
样 ， 一 个 ARP 分 组 封装 在 链 路 层 帧 中 ， 因 而 在 体系 结构 上 位 于 链 路 层 之 上 。 然 而 ,一 个 
ARP 分 组 具有 包含 链 路 层 地 址 的 字段 ， 因 而 可 认为 是 链 路 层 协议 , 但 它 也 包含 网 络 层 地 
址 ， 因 而 也 可 认为 是 为 网 络 层 协议 。 所 以 ， 可 能 最 好 把 ARP 看 成 是 跨越 链 路 层 和 网 络 层 
边界 两 边 的 协议 ， 即 不 完全 符合 我 们 在 第 1 章 中 学 习 的 简单 的 分 层 协议 栈 。 现 实 世界 协议 
就 是 这 样 复 杂 ! 

3. 发 送 数据 报到 子 网 以 外 


现在 应 该 搞 清 楚 当 一 台 主 机 要 向 相同 子 网 上 的 男 一 台 主 机 发 送 一 个 数据 报时 ARP 的 
操作 过 程 。 但 是 现在 我 们 来 看 更 复杂 的 情况 ， 即 当 子 网 中 的 某 主机 要 向 子 网 之 外 (也 就 是 
跨越 路 由 器 的 另 一 个 子 网 ) 的 主机 发 送 网 络 层 数据 报 的 情况 。 我 们 在 图 6-19 的 环境 中 来 
讨论 这 个 问题 ， 该 图 显示 了 一 个 由 一 台 路 由 器 互联 两 个 子 网 所 组 成 的 简单 网 络 。 
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图 6-19 由 一 台 路 由 器 互联 的 两 个 子 网 


有 关 图 6-19 需要 注意 几 件 有 趣 的 事情 。 每 台 主机 仅 有 一 个 卫 地 址 和 一 个 适配器 。 但 
是 ， 如 第 4 章 所 讨论 ， 一 台 路 由 器 对 它 的 每 个 接口 都 有 一 个 P 地 址 。 对 路 由 器 的 每 个 接 
口 ，( 在 路 由 器 中 ) 也 有 一 个 ARP 模块 和 一 个 适配器 。 在 图 6-19 中 的 路 由 器 有 两 个 接口 ， 
AEA PI IP 地 址 、 两 个 ARP 模块 和 两 个 适配器 。 当 然 ， 网 络 中 的 每 个 适配器 都 有 自 
己 的 MAC 地 址 。 

还 要 注意 到 子 网 1 的 网 络 地 址 为 111. 111. 111/24, 子 网 2 的 网 络 地 址 为 222. 222. 222/24。 
因此 ， 与 子 网 1 相连 的 所 有 接口 都 有 格式 为 111. 111. 111. xxx 的 地 址 ， 与 子 网 2 相连 的 所 
有 接口 都 有 格式 为 222. 222. 222. xxx 的 地 址 。 

现在 我 们 考察 子 网 1 上 的 一 台 主 机 将 向 子 网 2 上 的 一 台 主 机 发 送 数据 报 。 特 别 是 ， 假 
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设 主机 111. 111. 111. 111 要 向 主机 222. 222. 222. 222 发 送 一 个 IP 数据 报 。 和 往常 一 样 ， 发 
送 主机 向 它 的 适配器 传递 数据 报 。 但 是 ， 发 送 主机 还 必须 向 它 的 适配器 指示 一 个 适当 的 目 
AY MAC 地 址 。 该 适配器 应 该 使 用 什么 MAC 地 址 呢 ? 有 人 也 许 大 胆 猜 测 ， 这 个 适当 的 MAC 
地 址 就 是 主机 222. 222. 222. 222 的 适配器 地 址 ， 即 49-BD- D2-C7-56-2A。 然 而 ， 这 个 猜测 
是 错误 的 ! 如 果 发 送 适配器 要 用 那个 MAC 地 址 ， 那 么 子 网 1 上 所 有 的 适配器 都 不 会 费心 
将 该 四 数据 报 传递 到 它 的 网 络 层 ， 因 为 该 帧 的 目的 地 址 与 子 网 1 上 所 有 适配器 的 MAC 地 
址 都 将 不 匹配 。 这 个 数据 报 将 只 有 死亡 ， 到 达 数 据 报 天 国 。 

如 果 我 们 仔细 地 观察 图 6-19， 我 们 发 现 为 了 使 一 个 数据 报 从 111. 111. 111. 111 到 子 网 
2 上 的 主机 ， 该 数据 报 必 须 首先 发 送 给 路 由 器 接口 111. 111. 111. 110， 它 是 通 往 最 终 目 的 
地 路 径 上 的 第 一 跳 路 由 器 的 IP 地址 。 因 此 ， 对 于 该 帧 来 说 ， 适 当 的 MAC 地 址 是 路 由 器 接 
口 111.111. 111. 110 的 适配器 地 址 ， 即 E6- E9- 00- 17- BB- 4B。 但 发 送 主 机 怎样 获得 
111. 111. 111. 110 的 MAC 地 址 呢 ? 当然 是 通过 使 用 ARP! 一 旦 发 送 适 配器 有 了 这 个 MAC 
地 址 ， 它 创建 一 个 帧 (包含 了 寻 址 到 222. 222. 222. 222 的 数据 报 ) ， 并 把 该 帧 发 送 到 子 网 1 
中 。 在 子 网 1 上 的 路 由 器 适配器 看 到 该 链 路 层 帧 是 向 它 寻 址 的 ， 因 此 把 这 个 帧 传递 给 路 由 
器 的 网 络 层 。 万 岁 ! 该 中 数据 报 终 于 被 成 功 地 从 源 主机 移动 到 这 台 路 由 器 了 ! 但 是 我 们 
的 任务 还 没有 结束 。 我 们 仍然 要 将 该 数据 报 从 路 由 器 移动 到 目的 地 。 路 由 器 现在 必须 决定 
该 数据 报 要 被 转发 的 正确 接口 。 如 在 第 4 章 中 所 讨论 的 ， 这 是 通过 查询 路 由 器 中 的 转发 表 
来 完成 的 。 转 发 表 告 诉 这 人 台 路 由 器 该 数据 报 要 通过 路 由 器 接口 222. 222. 222. 220 转发 。 然 
后 该 接口 把 这 个 数据 报 传递 给 它 的 适配器 ， 适 配器 把 该 数据 报 封 装 到 一 个 新 的 帧 中 ， 并 且 
将 帧 发 送 进 子 网 2 中 。 这 时 ， 该 帧 的 目的 MAC 地 址 确实 是 最 终 目的 地 MAC 地 址 。 路 由 器 
又 是 怎样 获得 这 个 目的 地 MAC 地 址 的 呢 ? 当然 是 用 ARP 获得 的 ! 

用 于 以 太 网 的 ARP 定义 在 RFC 826 中 。 在 TCP/IP 指南 RFC 1180 中 对 ARP 进行 了 很 
好 的 介绍 。 我 们 将 在 课 后 习题 中 更 为 详细 地 研究 ARP。 


6.4.2 WARM 


以 太 网 几乎 占领 着 现 有 的 有 线 局 域 网 市 场 。 在 20 世纪 80 年 代 和 90 年 代 早期 ， 以 太 
网 面临 着 来 自 其 他 局 域 网 技术 包括 令 牌 环 、FDDI Fil ATM 的 挑战 。 多 年 来 ， 这 些 其 他 技术 
中 的 一 些 成 功 地 抓 住 了 部 分 局 域 网 市 场 份额 。 但 是 自从 20 世纪 70 年 代 中 期 发 明 以 太 网 以 
来 ， 它 就 不 断 演化 和 发 展 ， 并 保持 了 它 的 支配 地 位 。 今天; 以 太 网 是 到 目前 为 止 最 流行 的 
有 线 局 域 网 技术 ， 而 且 到 可 能 预见 的 将 来 它 可 能 仍 保持 这 一 位 置 。 可 以 这 么 说 ， 以 太 网 对 
本 地 区 域 联网 的 重要 性 就 像 因特网 对 全 球 联网 所 具有 的 地 位 那样 。 

以 太 网 的 成 功 有 很 多 原因 。 首 先 ， 以 太 网 是 第 一 个 广泛 部 署 的 高 速 局 域 网 。 因 为 它 部 
署 得 早 ， 网 络 管理 员 非 常熟 悉 以 太 网 ( 它 的 奇迹 和 它 的 奇 思 妙 想 ) ， 并 当 其 他 局 域 网 技术 
问世 时 ， 他 们 不 愿意 转 而 用 之 。 其 次 ， 令 牌 环 、EDDI 和 ATM 比 以 太 网 更 加 复杂 、 更 加 昂 
贵 ， 这 就 进一步 阻碍 了 网 络 管理 员 改 用 其 他 技术 。 第 三 ， 改 用 其 他 局 域 网 技术 〈 例 如 
FDDI 和 ATM) 的 最 引 人 注 目的 原因 通常 是 这 些 新 技术 具有 更 高 数据 速率 ; 然而 以 太 网 总 
是 奋起 抗争 ， 产 生 了 运行 在 相同 或 更 高 数据 速率 下 的 版 本 。20 世纪 90 年 代 初 期 引入 了 交 
换 以 太 网 ， 这 就 进一步 增加 了 它 的 有 效 数据 速率 。 最 后 ， 由 于 以 太 网 已 经 很 流行 了 ， 所 以 
以 太 网 硬件 (尤其 是 适配器 和 交换 机 ) 成 了 一 个 普通 商品 ， 而 且 极 为 便宜 。 

Bob Metcalfe 和 David Boggs 在 20 世纪 70 年 代 中 期 发 明 初始 的 以 太 局 域 网 。 初 始 的 以 
太 局 域 网 使 用 同 轴 电缆 总 线 来 互联 节点 。 以 太 网 的 总 线 拓扑 实际 上 从 20 世纪 80 年 代 到 90 
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年 代 中 期 一 直 保 持 不 变 。 使 用 总 线 拓扑 的 以 太 网 是 一 种 广播 局 域 网 ， 即 所 有 传输 的 帧 传送 
到 与 该 总 线 连接 的 所 有 适配器 并 被 其 处 理 。 回 忆 一 下 ,我们 在 6. 3. 2 节 中 讨论 了 以 太 网 的 
具有 二 进 制 指数 回 退 的 CSMA/CD 多 路 访问 协议 。 

到 了 20 世纪 90 年 代 后 期 ， 大 多 数 公 司 和 大 学 使 用 一 种 基于 集线器 的 星 形 拓扑 以 太 网 
安装 替代 了 它们 的 局 域 网 。 在 这 种 安装 中 ， 主 机 (和 路 由 器 ) 直接 用 双 绞 对 铜 线 与 一 台 集 
线 器 相连 。 集 线 器 (hub) 是 一 种 物理 层 设 备 ， 它 作用 于 各 个 比特 而 不 是 作用 于 帧 。 当 表 
示 一 个 0 或 一 个 1 的 比特 到 达 一 个 接口 时 ， 集 线 器 只 是 重新 生成 这 个 比特 ， 将 其 能 量 强度 
放大 ， 并 将 该 比特 向 其 他 所 有 接口 传输 出 去 。 因 此 ， 采 用 基于 集线器 的 星 形 拓扑 的 以 太 网 
也 是 一 个 广播 局 域 网 ， 即 无 论 何 时 集线器 从 它 的 一 个 接口 接收 到 一 个 比特 ， 它 向 其 所 有 其 
他 接口 发 送 该 比特 的 副本 。 特 别 是 ， 如 果 某 集线器 同时 从 两 个 不 同 的 接口 接收 到 帧 ， 将 出 
现 一 次 碰撞 ， 生 成 该 帧 的 节点 必须 重新 传输 该 帧 。 

在 21 世纪 初 ， 以 太 网 又 经 历 了 一 次 重要 的 革命 性 变化 。 以 太 网 安装 继续 使 用 星 形 拓 
扑 ， 但 是 位 于 中 心 的 集线器 被 交换 机 (switch) 所 替代 。 在 本 章 后 面 我 们 将 深入 学 习 交 换 
以 太 网 。 眼 下 我 们 仅 知 道 交 换 机 不 仅 是 “无 碰撞 的 ”， 而 且 也 是 名 副 其 实 的 存储 转发 分 组 
交换 机 就 可 以 了 ; 但 是 与 运行 在 高 至 第 三 层 的 路 由 器 不 同 ， 交 换 机 仅 运行 在 第 二 层 。 

1. 以 太 网 帧 结构 

以 太 网 由 如 图 6-20 所 示 。 通 过 仔细 研究 以 太 网 的 帧 ， 我 们 能 够 学 到 许多 有 关 以 太 网 
的 知识 。 


MIS Rie MME cE 
类 型 
图 6-20 ”以 太 网 帧 结构 


为 了 将 对 以 太 网 帧 的 讨论 放 到 切实 的 环境 中 ， 考 虑 从 一 台 主 机 向 另 一 台 主 机 发 送 一 个 
IP 数据 报 ， 且 这 两 台 主 机 在 相同 的 以 太 局 域 网 上 (例如 ， 如 图 6-17 所 示 的 以 太 局 域 网 ) 。 
(尽管 以 太 网 帧 的 负载 是 一 个 人 P 数据 报 ， 但 我 们 注意 到 以 太 网 帧 也 能 够 承载 其 他 网 络 层 分 
组 。) 设 发 送 适配器 〈 即 适配器 A) 的 MAC 地 址 是 AA-AA-AA-AA-AA-AA， 接 收 适 配器 
( 即 适 配器 B) 的 MAC 地 址 是 BB-BB-BB-BB-BB-BB。 发 送 适 配器 在 一 个 以 太 网 帧 中 封装 
了 一 个 中 数据 报 ， 并 把 该 帧 传递 到 物理 层 。 接 收 适配器 从 物理 层 收 到 这 个 帧 ， 提 取出 IP 
数据 报 ， 并 将 该 IP 数据 报 传递 给 网 络 层 。 我 们 现在 在 这 种 情况 下 考察 如 图 6-20 所 示 的 以 
太 网 帧 的 6 个 字段: 
。 数据 字段 (46 ~ 1500 字 节 ) 。 这 个 字段 承载 了 卫 数据 报 。 以 太 网 的 最 大 传输 单元 
(MTU) 是 1500 字 节 。 这 意味 着 如 果 IP 数据 报 超过 了 1500 字 节 ， 则 主机 必须 将 
该 数据 报 分 片 ， 如 4. 3. 2 节 所 讨论 。 数 据 字段 的 最 小 长 度 是 46 字 节 。 这 意味 着 如 
果 了 下 数据 报 小 于 46 字 节 ， 数 据 报 必须 被 填充 到 46 字 节 。 当 采用 填充 时 ， 传 递 到 
网 络 层 的 数据 包括 全 数据 报 和 填充 部 分 。 网 络 层 使 用 他 数据 报 首部 中 的 长 度 字 有 段 
来 去 除 填充 部 分 。 
。 目的 地 址 (6 字 节 )。 这 个 字段 包含 目的 适配器 的 MAC 地 址 ， 即 BB- BB- BB- BB- 
BB-BB。 当 适配器 B 收 到 一 个 以 太 网 帧 ， 帧 的 目的 地 址 无 论 是 BB- BB- BB-BB- BB- 
BB， 还 是 MAC 广播 地 址 ， 它 都 将 该 帧 的 数据 字段 的 内 容 传递 给 网 络 层 ; 如 果 它 收 
到 了 具有 任何 其 他 MAC 地 扯 的 帧 ， 则 丢弃 之 。 
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© 源 地 址 (6 字 节 )。 这 个 字段 包含 了 传输 该 帧 到 局 域 网 上 的 适配器 的 MAC 地 址 ， 
在 本 例 中 为 AA-AA-AA-AA-AA-AA。 
© 类 型 字段 (2 字 节 ) 。 类 型 字段 允许 以 太 网 复 用 多 种 网 络 层 协议 。 为 了 理解 这 点 ， 
我 们 需要 记 住 主机 能 够 使 用 除了 IP 以 外 的 其 他 网 络 层 协议 。 事 实 上 ， 一 人 台 给 定 的 
主机 可 以 支持 多 种 网 络 层 协 议 ， 以 对 不 同 的 应 用 采用 不 同 的 协议 。 因 此 ， 当 以 太 
网 帧 到 达 适 配器 B， 适 配器 B 需要 知道 它 应 该 将 数据 字段 的 内 容 传递 给 哪个 网 络 
层 协议 〈 即 分 解 ) IP 和 其 他 链 路 层 协议 (例如 ，Novell IPX 或 AppleTalk) 都 有 
它们 各 自 的、 标准 化 的 类 型 编号 。 此 外 ，ARP 协议 (在 上 一 节 讨论 过 ) 有 自己 的 
类 型 编号 ， 并 且 如 果 到 达 的 帧 包含 ARP 分 组 〈 即 类 型 字段 的 值 为 十 六 进 制 的 
0806) ， 则 该 ARP 分 组 将 被 多 路 分 解 给 ARP 协议 。 注 意 到 该 类 型 字段 和 网 络 层 数 
据 报 中 的 协议 字段 、 运 输 层 报 文 段 的 端口 号 字段 相 类 似 ; 所 有 这 些 字 段 都 是 为 了 
把 一 层 中 的 某 协 议 与 上 一 层 的 某 协议 结合 起 来 。 
© CRC (4 字 节 )。 如 6.2.3 节 中 讨论 的 那样 ，CRC (循环 宛 余 检测 ) 字段 的 目的 是 
使 得 接收 适配器 〈 适 配器 B) 检测 帧 中 是 否 引入 了 差错 。 
前 同步 码 (8 字 节 )。 以 太 网 帧 以 一 个 8 字 节 的 前 同步 码 (Preamble) 字段 开始 。 
该 前 同步 码 的 前 7 字 节 的 值 都 是 10101010; 最 后 一 个 字 节 是 10101011。 前 同步 码 
字段 的 前 7 字 节 用 于 “唤醒 ”接收 适配器 ， 并 且 将 它们 的 时 钟 和 发 送 方 的 时 钟 同 
步 。 为 什么 这 些 时 钟 会 不 同步 呢 ? 记 住 适配器 A 的 目的 是 根据 以 太 局 域 网 类 型 的 
不 同 ， 分 别 以 10Mbps、100Mbps 或 者 1Gbps 的 速率 传输 帧 。 然 而 ， 没 有 什么 是 完 
美 无 缺 的 ， 因 此 适配器 A 不 会 以 精确 的 额定 速率 传输 帧 ， 相 对 于 额定 速率 总 有 一 
些 漂 移 ， 局 域 网 上 的 其 他 适配器 不 会 预先 知道 这 种 漂移 的 。 接 收 适 配 右 只 需 通 过 
锁定 前 同步 码 的 前 7 字 节 的 比特 ， 就 能 够 锁定 适配器 A 的 时 钟 。 前 同步 码 的 第 8 
个 字 节 的 最 后 两 个 比特 (第 一 个 出 现 的 两 个 连续 的 1) 警告 适配器 B, “重要 的 内 
容 ” 就 要 到 来 了 。 

所 有 的 以 太 网 技术 都 向 网 络 层 提供 无 连接 服务 。 这 就 是 说 ， 当 适配器 A 要 向 适配器 B 
发 送 一 个 数据 报时 ， 适 配器 A 在 一 个 以 太 网 帧 中 封装 该 数据 报 ， 并 且 把 该 帧 发 送 到 局 域 网 
上 ， 没 有 先 与 适配器 B 握手 。 这 种 第 二 层 的 无 连接 服务 类 似 于 人 P 的 第 三 层 数 据 报 服务 和 
UDP 的 第 四 层 无 连接 服务 。 ， 

以 太 网 技术 都 向 网 络 层 提供 不 可 靠 服务 。 特 别 是 ， 当 适配器 B 收 到 一 个 来 自 适配器 A 
的 帧 ， 它 对 该 帧 执行 CRC 校 验 , 但 是 当 该 帧 通过 CRC 校 验 时 它 既 不 发 送 确认 帧 ; 而 当 该 
帧 没有 通过 CRC 校 验 时 它 也 不 发 送 否定 确认 帧 。 当 某 帧 没有 通过 CRC 校 验 ， 适 配器 B 只 
是 丢弃 该 帧 。 因 此 ， 适 配器 A 根本 不 知道 它 传输 的 帧 是 否 到 达 了 B 并 通过 了 CRC 校 验 。 
(在 链 路 层 ) 缺乏 可 靠 的 传输 有 助 于 使 得 以 太 网 简单 和 便宜 。 但 是 它 也 意味 着 传递 到 网 络 
层 的 数据 报 流 能 够 有 间隙 。 

如 果 由 于 丢弃 了 以 太 网 帧 而 存在 间隙， 主机 B 上 的 应 用 也 会 看 见 这 个 间隙 吗 ? 如 我 们 
在 第 3 章 中 学 习 的 那样 ， 这 只 取决 于 该 应 用 是 使 用 UDP 还 是 使 用 TCP。 如 果 应 用 使 用 的 是 
UDP， 则 主机 B 中 的 应 用 的 确 会 看 到 数据 中 的 间隙 。 另 一 方面 ， 如 果 应 用 使 用 的 是 TCP, 
则 主机 B 中 的 TCP 将 不 会 确认 包含 在 丢弃 帧 中 的 数据 ， 从 而 引起 主机 A 的 TCP 重 传 。 注 
意 到 当 TCP 重 传 数 据 时 ， 数 据 最 终 将 回 到 曾经 丢弃 它 的 以 太 网 适配器 。 因 此 ， 从 这 种 意义 
上 来 说 ， 以 太 网 的 确 重 传 了 数据 ， 尽 管 以 太 网 并 不 知道 它 是 正在 传输 一 个 具有 全 新 数据 的 
全 新 数据 报 ， 还 是 一 个 包含 已 经 被 传输 过 至 少 一 次 的 数据 的 数据 报 。 
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Bob Metcalfe 和 以 太 网 


作为 20 世纪 70 年 代 早 期 哈佛 大 学 的 一 名 博士 生 ，Bob Metcalfe 在 MIT 从 事 ARPA- 
net 的 研究 。 在 他 学 习 期 间 ， 他 还 受到 了 Abramson 有 关 ALOHA 和 随机 接 入 协议 工作 的 
影响 。 在 完成 了 他 的 博士 学 位 ， 并 在 开始 Xerox Palo Alto 研究 中 心 (Xerox PARC) 的 工 
作 之 前 ， 他 用 3 个 月 访问 了 Abramson 和 他 在 夏威夷 大 学 的 同事 ， 获 得 了 ALOHAnet 的 第 
一 手 资料 。 在 Xerox PARC, Metcalfe 受到 了 Alto 计算 机 的 影响 ， 这 种 计算 机 在 很 多 方面 
是 20 世纪 80 年 代 个 人 计算 机 的 先驱 。Metcalfe 看 到 了 对 这 些 计算 机 以 一 种 不 昂贵 的 方 
式 组 网 的 需求 。 因 此 ， 基 于 他 在 APRAnet、ALOHAnet 和 随机 接 入 协议 方面 的 知识 ， 
Metcalfe 和 他 的 同事 David Boggs 一 起 发 明了 以 太 网 。 

Metcalfe 和 Boggs 的 初始 以 太 网 运行 速度 为 2. 94Mbps， 连 接 长 达 一 英里 范围 的 多 达 
256 台 主 机 。Metcalfe 和 Boggs 成 功 地 使 得 Xerox PARC 的 大 多 数 研 究 人 员 通 过 他 们 的 
Alto 计算 机 互相 通信 。 然 后 Metcalfe 推进 了 Xerox, Digital 和 Intel 联盟 ， 创 建 了 以 太 网 
作为 一 种 10Mbps 的 以 太 网 标准 ， 该 标准 后 被 IEEE 认可 。Xerox 对 以 太 网 商业 化 没有 表 
现 出 太 多 的 兴趣 。1979 年 ，Metcalfe 建立 了 自己 的 公司 3Com， 它 发 展 和 商业 化 包括 以 
太 网 技术 在 内 的 联网 技术 。 特 别 是 ，3Com 在 20 世纪 80 年 代 早 期 为 非常 流行 的 IBM PC 
开发 了 以 太 网 网 卡 并 使 之 市 场 化 。 














2. 以 太 网 技术 

在 以 上 的 讨论 中 我 们 已 经 提 到 以 太 网 ， 仿 佛 它 有 单一 的 协议 标准 似 的 。 但 事实 上 ， 以 
太 网 具有 许多 不 同 的 特色 ， 具 有 某 种 令 人 有 眼花 综 乱 的 首 字母 缩写 词 ， 如 LOBASE-T, 
10BASE-2, 100BASE-T, 1000BASE-LX 和 10GBASE-T。 这 些 以 及 许多 其 他 的 以 太 网 技术 
在 多 年 中 已 经 被 IEEE 802.3 CSMA/CD( Ethemet) 工作 组 标准 化 了 [IEEE 802.3 2012], 
尽管 这 些 首 字母 缩写 词 看 起 来 眼花 练 乱 ,实际 上 其 中 非常 有 规律 性 。 首 字母 缩写 词 的 第 一 
部 分 指 该 标准 的 速率 : 10、100、1000 或 10G, 分 别 代 表 10Mbps、100Mbps、1000Mbps 
(或 1Gbps) 和 10Gbps 以 太 网 。“BASE” 指 基带 以 太 网 ， 这 意味 着 该 物理 媒体 仅 承 载 以 太 
网 流量 ; 几乎 所 有 的 802. 3 标准 都 适用 于 基带 以 太 网 。 该 首 字母 缩写 词 的 最 后 一 部 分 指 物 
理 媒体 本 身 ; 以 太 网 是 链 路 层 也 是 物理 层 的 规范 ， 并 且 能 够 经 各 种 物理 媒体 (包括 同 轴 电 
绕 、 铜 线 和 光纤 ) 承载 。 一 般 而 言 ,“T” 指 双 绞 铜 线 。 

从 历史 上 讲 ， 以 太 网 最 初 被 构想 为 一 段 同 轴 电 缆 。 早 期 的 10BASE-2 和 10BASE-5 标 
准 规定 了 在 两 种 类 型 的 同 轴 电 缆 之 上 的 10Mbps 以 太 网 ， 每 种 标准 都 限制 在 500 米 长 度 之 
内 。 通 过 使 用 转发 器 (repeater) 能 够 得 到 更 长 的 运行 距离 ， 而 转发 器 是 一 种 物理 层 设备 ， 
它 能 在 输入 端 接收 信号 并 在 输出 端 再 生 该 信号 。 同 轴 电 缆 很 好 地 对 应 于 我 们 将 作为 一 种 广 
播 媒 体 的 以 太 网 视图 ， 即 由 一 个 接口 传输 的 所 有 帧 可 在 其 他 接口 收 到 ， 并 且 以 太 网 的 
CSMA/CD 协议 很 好 地 解决 了 多 路 访问 问题 。 节 点 直接 附着 在 电缆 上 ， 万 事 大 吉 ， 我 们 有 
了 一 个 局 域 网 了 ! 

多 年 来 以 太 网 已 经 经 历 了 一 系列 演化 步骤 ,今天 的 以 太 网 非常 不 同 于 使 用 同 轴 电缆 的 
初始 总 线 拓扑 的 设计 。 在 今天 大 多 数 的 安装 中 ， 节 点 经 点 对 点 的 由 双 绞 铜 线 或 光纤 线 缆 构 
成 的 线段 与 一 台 交 换 机 相连 ， 如 图 6-15 至 图 6-17 所 示 。 
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在 20 世纪 90 年 代 中 期 ， 以 太 网 被 标准 化 为 100Mbps， 比 10Mbps 以 太 网 快 10 倍 。 初 
始 的 以 太 网 MAC 协议 和 帧 格式 保留 了 下 来 ,但 更 高 速率 的 物理 层 被 定义 为 用 铜 线 
(100BASE-T) 和 用 光纤 (100BASE-FX、100BASE-SX、100BASE-BX) 。 图 6-21 显示 了 这 
些 不 同 的 标准 和 共同 的 以 太 网 MAC 协议 和 帧 格式 。100Mbps 以 太 网 用 双 绞 线 距 离 限 制 为 
100 米 ， 用 光纤 距离 限制 为 几 千 米 ， 人 允许 把 不 同 建筑 物 中 的 以 太 网 交换 机 连接 起 来 。 


A MAC 协 议和 帧 格式 


| 100BASE-TX | | 100BASE-T2 || 100BASE-FX 
my! 
| | 100BASE-T4 || 100BASE-SX || 100BASE-BX 


图 6-21 100Mbps 以 太 网 标准 : 共同 的 链 路 层 ， 不 同 的 物理 层 


吉 比 特 以 太 网 是 对 极为 成 功 的 10Mbps 和 100Mbps 以 太 网 标准 的 扩展 。40Gbps 以 太 网 
提供 40 000Mbps 的 总 数据 速率 ， 与 大 量 已 经 安装 的 以 太 网 设备 基础 保持 完全 兼容 。 吉 比 
特 以 太 网 的 标准 称 为 IEEE 802. 3z， 它 完成 以 下 工作 : 

。 使 用 标准 以 太 网 帧 格式 (SILA 6-20) ， 并 且 后 向 兼容 10BASE-T 与 100BASE-T 
技术 。 这 使 得 吉 比 特 以 太 网 和 现 已 安装 的 以 太 网 设备 基础 很 容易 集成 。 
允许 点 对 点 链 路 以 及 共享 的 广播 信道 。 如 前 所 述 ， 点 对 点 链 路 使 用 交换 机 ， 而 广 
播 信道 使 用 集线器 。 在 吉 比 特 以 太 网 术语 中 ， 集 线 器 被 称 为 “ 带 缓存 的 分 配器 "。 

e 使 用 CSMA/CD 来 共享 广播 信道 。 为 了 得 到 可 接受 的 效率 ， 节 点 之 间 的 最 大 距离 

必须 严格 限制 。 

e 对 于 点 对 点 信道 ， 允 许 在 两 个 方向 上 都 以 40Gbps 全 双 工 操作 。 

吉 比 特 以 太 网 最 初 工作 于 光纤 之 上 ， 现 在 能 够 工作 在 5 类 UTP 线 缆 上 。 

我 们 通过 提出 一 个 问题 来 结束 有 关 以 太 网 技术 的 讨论 ， 这 个 问题 开始 可 能 会 难 倒 你 。 
在 总 线 拓扑 和 基于 集线器 的 星 形 拓扑 技术 时 代 ， 以 太 网 很 显然 是 一 种 广播 链 路 (如 6.3 i 
所 定义 )， 其 中 多 个 节点 同时 传输 时 会 出 现 帧 碰撞 。 为 了 处 理 这 些 碰 撞 ， 以 太 网 标准 包括 
了 CSMA/CD 协议 ,该 协议 对 于 跨越 一 个 小 的 地 理 半 径 的 有 线 广播 局 域 网 特别 有 效 。 但 是 
对 于 今天 广 为 使 用 的 以 太 网 是 基于 交换 机 的 星 形 拓 扑 ， 采 用 的 是 存储 转发 分 组 交换 ， 是 否 
还 真正 需要 一 种 以 太 网 MAC 协议 呢 ? 如 我 们 很 快 所 见 ， 交 换 机 协调 其 传输 ， 在 任何 时 候 
决 不 会 向 相同 的 接口 转发 超过 一 个 帧 。 此 外 ， 现 代 交 换 机 是 全 双 工 的 ， 这 使 得 一 台 交 换 机 
和 一 个 节点 能 够 在 同时 向 对 方 发 送 帧 而 没有 干扰 。 换 句 话 说， 在 基于 交换 机 的 以 太 局 域 网 
中 ， 不 会 有 碰撞 ， 因 此 没有 必要 使 用 MAC 协议 了 ! 

如 我 们 所 见 ， 今 天 的 以 太 网 与 Metcalfe 和 Boggs 在 30 多 年 前 构想 的 初始 以 太 网 有 非常 
大 的 不 同 ， 即 速度 已 经 增加 了 3 个 数量 级 ， 以 太 网 帧 承载 在 各 种 各 样 的 媒体 之 上 ， 交 换 以 
太 网 已 经 成 为 主流 ， 此 时 甚至 连 MAC 协议 也 经 常 是 不 必要 的 了 ! 所 有 这 些 还 真正 是 以 太 
网 吗 ? 答案 当然 是 :“ 是 的 ， 根据 定 义 如 此 。” 然 而， 注意 到 下 列 事实 是 有 趣 的 : 通过 所 有 
这 些 改变 ， 的 确 还 有 一 个 历经 30 年 保持 未 变 的 持久 不 变量 ， 即 以 太 网 帧 格式 。 也 许 这 才 
是 以 太 网 标准 的 一 个 真正 重要 的 特征 。 


6.4.3 链 路 层 交 换 机 
到 目前 为 止 , 我 们 有 意 对 交换 机 实际 要 做 的 工作 以 及 它 是 怎样 工作 的 含糊 其 辞 。 交 换 
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机 的 任务 是 接收 入 链 路 层 帧 并 将 它们 转发 到 出 链 路 ; 我 们 将 在 这 一 节 中 详细 学 习 这 种 转发 
功能 。 我 们 将 看 到 交换 机 自身 对 子 网 中 的 主机 和 路 由 器 是 透明 的 transparent); 这 就 是 
说 ， 某 主机 /路 由 器 向 另 一 个 主机 /路 由 器 寻 址 一 个 帧 〈 而 不 是 向 交换 机 寻 址 该 帧 ) ， 顺 利 
地 将 该 帧 发 送 进 局 域 网 ， 并 不 知道 某 交 换 机 将 会 接收 该 帧 并 将 它 转发 到 另 一 个 节点 。 这 些 
帧 到 达 该 交换 机 的 任何 输出 接口 之 一 的 速率 可 能 暂时 会 超过 该 接口 的 链 路 容量 。 为 了 解决 
这 个 问题 ， 交 换 机 输出 接口 设 有 缓存 ， 这 非常 类 似 于 路 由 器 接口 为 数据 报 设 有 缓存 。 现 在 
我 们 来 仔细 考察 交换 机 运行 的 原理 。 

1. 交换 机 转发 和 过 滤 

过 滤 (filtering) 是 决定 一 个 帧 应 该 转发 到 某 个 接口 还 是 应 当 将 其 丢弃 的 交换 机 功能 。 
HER (forwarding) 是 决定 一 个 帧 应 该 被 导向 哪个 接口 ， 并 把 该 帧 移动 到 那些 接口 的 交换 
机 功能 。 交 换 机 的 过 滤 和 转发 借助 于 交换 机 表 (switch table) 完成 。 该 交换 机 表 包 含 某 局 
域 网 上 某 些 主 机 和 路 由 器 的 但 不 必 是 全 部 的 表 项 。 交 换 机 表 中 的 一 个 表 项 包含 : 四 一 个 
MAC 地 址 ; @) 通 向 该 MAC 地 址 的 交换 机 接口 ; @ 表 项 放置 在 表 中 的 时 间 。 图 6-22 中 显示 
了 图 6-15 中 最 上 方 交 换 机 的 一 个 交换 机 表 的 例子 。 尽 管 帧 转发 的 描述 听 起 来 类 似 于 第 4 
章 讨论 的 数据 转发 ， 但 我 们 将 很 快 看 到 它们 之 间 有 重要 的 差异 。 确 实在 4. 4 节 中 一 般 化 转 
发 的 讨论 中 我 们 学 习 过 ， 许 多 现代 分 组 交换 机 能 够 被 配置 ， 以 基于 第 二 层 目的 MAC 地 址 
( 即 起 着 第 二 层 交换 机 的 功能 ) 或 者 第 三 层 他 目的 地 址 ( 即 起 着 第 三 层 交换 机 的 功能 ) 进 
行 转发 。 无 论 如何 ， 我 们 将 对 交换 机 基于 MAC 地 址 而 不 是 基于 IP 地 址 转发 分 组 进行 明确 
区 分 。 我 们 也 将 看 到 传统 的 即 处 于 非 SDN 环境 ) 交换 机 表 的 构造 方式 与 路 由 器 转发 表 
的 构造 方式 有 很 大 不 同 。 





地 址 
62-FE-F7-11-89- A3 1 9:32 
7C-BA-B2-B4-91-10 3 9:36 














图 6-22 图 6-15 中 最 上 面 交换 机 的 交换 机 表 的 一 部 分 


为 了 理解 交换 机 过 滤 和 转发 的 工作 过 程 ， 假 定 目的 地 址 为 DD-DD- DD- DD- DD-DD 的 
帧 从 交换 机 接口 x 到 达 。 交 换 机 用 MAC 地 址 DD-DD-DD-DD-DD-DD 索引 它 的 表 。 有 3 种 
可 能 的 情况 : 
e 表 中 没有 对 于 DD-DD-DD-DD-DD-DD 的 表 项 。 在 这 种 情况 下 ， 交 换 机 向 除 接口 x 
外 的 所 有 接口 前 面 的 输出 缓存 转发 该 帧 的 副本 。 换 言 之 ， 如 果 没 有 对 于 目的 地 址 
的 表 项 ， 交 换 机 广播 该 帧 。 
。 表 中 有 一 个 表 项 将 DD-DD-DD-DD-DD-DD 与 接口 x 联系 起 来 。 在 这 种 情况 下 ， 该 
帧 从 包括 适配器 DD-DD-DD-DD-DD-DD 的 局 域 网 网 段 到 来 。 无 须 将 该 帧 转发 到 任 
何其 他 接口 ， 交 换 机 通过 丢弃 该 帧 执行 过 滤 功能 即 可 。 
。 表 中 有 一 个 表 项 将 DD-DD-DD-DD-DD-DD 与 接口 y 关 x 联系 起 来 。 在 这 种 情况 下 ， 
该 帧 需要 被 转发 到 与 接口 y 相连 的 局 域 网 网 段 。 交 换 机 通过 将 该 帧 放 到 接口 y 前 
面 的 输出 缓存 完成 转发 功能 。 
我 们 大 致 地 看 一 下 用 于 图 6-15 中 最 上 面 交换 机 的 这 些 规则 以 及 图 6-22 中 所 示 的 它 的 
交换 机 表 。 假 设 目 的 地 址 为 62-FE-F7-11-89-A3 的 一 个 帧 从 接口 1 到 达 该 交换 机 。 交 换 机 
检查 它 的 表 并 且 发 现 其 目的 地 是 在 与 接口 1 相连 的 局 域 网 网 段 上 ( 即 电 气 工 程 系 的 局 域 
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网 ) 。 这 意味 着 该 帧 已 经 在 包含 目的 地 的 局 域 网 网 段 广播 过 了 。 因 此 该 交换 机 过 滤 (BE 
F) 了 该 帧 。 现 在 假设 有 同样 目的 地 址 的 帧 从 接口 2 到 达 。 交 换 机 再 次 检查 它 的 表 并 且 发 现 
其 目的 地 址 在 接口 1 的 方向 上 ; 因此 它 向 接口 1 前 面 的 输出 缓存 转发 该 帧 。 这 个 例子 清楚 地 
表明 ， 只 要 交换 机 的 表 是 完整 和 准确 的 ， 该 交换 机 无 须 任 何 广播 就 向 着 目的 地 转发 帧 。 

在 这 种 意义 上 ， 交 换 机 比 集线器 更 为 “聪明 ”。 但 是 一 开始 这 个 交换 机 表 是 如 何 配置 
起 来 的 呢 ? 链 路 层 有 与 网 络 层 路 由 选择 协议 等 价 的 协议 吗 ? 或 者 必须 要 一 名 超 负荷 工作 的 
管理 员 人 工地 配置 交换 机 表 吗 ? 

2. 自学 习 

交换 机 具有 令 人 惊奇 的 特性 (特别 是 对 于 早已 超 负荷 工作 的 网 络 管理 员 )， 那 就 是 它 
的 表 是 自动 、 动 态 和 自治 地 建立 的 ， 即 没有 来 自 网 络 管理 员 或 来 自 配置 协议 的 任何 干预 。 
换 句 话说 ， 交 换 机 是 自学 习 (self-learning) 的 。 这 种 能 力 是 以 如 下 方式 实现 的 : 

1) 交换 机 表 初 始 为 空 。 

2) 对 于 在 每 个 接口 接收 到 的 每 个 人 帧 ， 该 交换 机 在 其 表 中 存储 : 中 在 该 帧 源 地 址 字 
段 中 的 MAC 地 址 ; @@ 该 帧 到 达 的 接口 ; 加 当前 时 间 。 交 换 机 以 这 种 方式 在 它 的 表 中 记录 
了 发 送 节点 所 在 的 局 域 网 网 段 。 如 果 在 局 域 网 上 的 每 个 主机 最 终 都 发 送 了 一 个 帧 ， 则 每 个 
主机 最 终 将 在 这 张 表 中 留 有 记录 。 | 

3) 如 果 在 一 段 时 间 ( 称 为 老化 期 (aging time)) 后 ,交换 机 没有 接收 到 以 该 地 址 作 
为 源 地 址 的 帧 ， 就 在 表 中 删除 这 个 地 址 。 以 这 种 方式 ， 如 果 一 台 PC 被 另 一 台 PC (有 具有 不 
同 的 适配器 ) 代替 ， 原 来 PC 的 MAC 地 址 将 最 终 从 该 交换 机 表 中 被 清除 掉 。 

我 们 粗略 地 看 一 下 用 于 图 6-15 中 最 上 面 交 换 机 的 自学 习性 质 以 及 在 图 6-22 中 它 对 应 
的 交换 机 表 。 假 设 在 时 刻 9:39, ， 源 地 址 为 01-12-23-34-45-56 的 一 个 帧 从 接口 2 到 达 。 假 
设 这 个 地 址 不 在 交换 机 表 中 。 于 是 交换 机 在 其 表 中 增加 一 个 新 的 表 项 ， 如 图 6-23 中 所 示 。 


地 址 时 间 
01-12-23-34-45-56 2 9:39 


62-FE-F7-11-89-A3 1 9:32 
7C-BA-B2-B4-91-10 3 9: 36 


6-23 ”交换 机 学 习 到 地 址 为 01-12-23-34-45-56 的 适配器 所 在 的 位 置 


继续 这 个 例子 ， 假 设 该 交换 机 的 老化 期 是 60min， 在 9: 32 ~ 10: 32 期 间 源 地 址 是 
62-FE-F7-11-89- A3 的 帧 没有 到 达 该 交换 机 。 那 么 在 时 刻 10: 32， 这 台 交 换 机 将 从 它 的 表 
中 删除 该 地 址 。 

交换 机 是 即 插 即 用 设备 〈plug-and-play device) ， 因 为 它们 不 需要 网 络 管理 员 或 用 户 的 
干预 。 要 安装 交换 机 的 网 络 管理 员 除 了 将 局 域 网 网 段 与 交换 机 的 接口 相连 外 ， 不 需要 做 其 
他 任何 事 。 管 理 员 在 安装 交换 机 或 者 当 某 主机 从 局 域 网 网 段 之 一 被 去 除 时 ， 他 没有 必要 配 
置 交换 机 表 。 交 换 机 也 是 双 工 的 ， 这 意味 着 任何 交换 机 接口 能 够 同时 发 送 和 接收 。 

3. 链 路 层 交 换 机 的 性 质 


在 描述 了 链 路 层 交 换 机 的 基本 操作 之 后 ， 我 们 现在 来 考虑 交换 机 的 特色 和 性 质 。 我 们 能 够 
指出 使 用 交换 机 的 几 个 优点 ， 它 们 不 同 于 如 总 线 或 基于 集线器 的 星 形 拓扑 那样 的 广播 链 路 ; 
。 消除 碰撞 。 在 使 用 交换 机 (不 使 用 集线器 ) 构建 的 局 域 网 中 ,没有 因 碰 撞 而 浪费 
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的 带宽 ! 交换 机 缓存 帧 并 且 决 不 会 在 网 段 上 同时 传输 多 于 一 个 帧 。 就 像 使 用 路 由 
器 一 样 ， 交 换 机 的 最 大 聚合 带宽 是 该 交换 机 所 有 接口 速率 之 和 。 因 此 ， 交 换 机 提 
供 了 比 使 用 广播 链 路 的 局 域 网 高 得 多 的 性 能 改善 。 

© 异 质 的 链 路 。 交 换 机 将 链 路 彼此 隔离 ， 因 此 局 域 网 中 的 不 同 链 路 能 够 以 不 同 的 速 
率 运 行 并 且 能 够 在 不 同 的 媒体 上 运行 。 例 如 ， 图 6-22 中 最 上 面 的 交换 机 有 3 条 
1Gbps 1000BASE-T 铜 缆 链 路 、2 条 100Mbps 10BASE- FX 光缆 链 路 和 1 条 100 
BASE-T 铜 缆 链 路 。- 因此 ， 对 于 原 有 的 设备 与 新 设备 混用 ， 交 换 机 是 理想 的 。 

。 管理 。 除 了 提供 强化 的 安全 性 (参见 插入 材料 “关注 安全 性 ”) ， 交 换 机 也 易于 进 
行 网 络 管理 。 例 如 ， 如 果 一 个 适配器 工作 异常 并 持续 发 送 以 太 网 帧 〈 称 为 快 而 含 
糊 的 〈jabbering) 适配器 ) ， 交 换 机 能 够 检测 到 该 问题 ， 并 在 内 部 断 开 异 常 适 配 
器 。 有 了 这 种 特色 ， 网 络 管理 员 不 用 起 床 并 开车 到 工作 场所 去 解决 这 个 问题 。 类 
似 地 ， 一 条 割断 的 缆 线 仅 使 得 使 用 该 条 缆 线 连接 到 交换 机 的 主机 断 开 连 接 。 在 使 
用 同 轴 电 缆 的 时 代 ， 许 多 网 络 管理 员 花 费 几 个 小 时 “沿线 巡 检 ” (或 者 更 准确 地 
说 “在 和 天花板 上 疏 行 ”) ， 以 找到 使 整个 网 络 瘫痪 的 电缆 断 开 之 处 。 交 换 机 也 收集 
带宽 使 用 的 统计 数据 、 碰 撞 率 和 流量 类 型 ， 并 使 这 些 信息 为 网 络 管理 者 使 用 。 这 
些 信息 能 够 用 于 调试 和 解决 问题 ， 并 规划 该 局 域 网 在 未 来 应 当 演 化 的 方式 。 研 究 
人 员 还 在 原型 系统 部 署 中 探讨 在 以 太 局 域 网 中 增加 更 多 的 管理 功能 ' [ Casado 2007 ; 
Koponen 2011 ] 。 














了 嗅 探 交换 局 域 网 : 交换 机 毒化 


当 一 台 主 机 与 某 交 换 机 相连 时 ， 它 通常 仅 接 收 到 明确 发 送 给 它 的 帧 。 例 如 ， 考 虑 在 
图 6-17 中 的 一 个 交换 局 域 网 。 当 主机 A 向 主机 了 发 送 帧 时 ， 在 交换 机 表 中 有 用 于 主机 
B 的 表 项 ， 则 该 交换 机 将 仅 向 主机 B 转发 该 帧 。 如 果 主 机 C 恰好 在 运行 嗅 探 器 ， 主 机 C 
将 不 能 够 嗅 探 到 A 到 了 的 帧 。 因 此 ， 在 交换 局 域 网 的 环境 中 (与 如 802. 11 局 域 网 或 基 
于 集线器 的 以 太 局 域 网 的 广播 链 路 环境 形成 对 比 ) ， 攻 击 者 嗅 探 帧 更 为 困难 。 然 而 ， 因 
为 交换 机 广播 那些 目的 地 址 不 在 交换 机 表 中 的 帧 ， 位 于 C 上 的 嗅 探 器 仍然 能 嗅 探 某 些 不 
是 明确 寻 址 到 C 的 帧 。 此 外 ， 嗅 探 器 将 能 够 嗅 探 到 具有 广播 地 址 FF-FF-FF-FF-FF-FF 的 
广播 帧 。 一 个 众所周知 的 对 抗 交换 机 的 攻击 称 为 交换 机 毒化 (switch poisoning) ， 它 向 交 
换 机 发 送 大 量 的 具有 不 同 伪 造 源 MAC 地 址 的 分 组 ， 因 而 用 伪造 表 项 填 满 了 交换 机 表 ， 
没有 为 合法 主机 留 下 空间 。 这 使 该 交换 机 广播 大 多 数 帧 ， 这 些 帧 则 能 够 由 嗅 探 器 停 获 到 
[ Skoudis 2006 ] 。 由 于 这 种 攻击 只 有 技艺 高 超 的 攻击 者 才能 做 到 ， 因 此 交换 机 比 起 集 线 
器 和 无 线 局 域 网 来 更 难受 到 嗅 探 。 








4. 交换 机 和 路 由 器 比较 


如 我 们 在 第 4 章 学 习 的 那样 ， 路 由 器 是 使 用 网 络 层 地 址 转发 分 组 的 存储 转发 分 组 交换 
机 。 尽 管 交 换 机 也 是 一 个 存储 转发 分 组 交换 机 ， 但 它 和 路 由 器 是 根本 不 同 的 ， 因 为 它 用 
MAC 地 址 转发 分 组 。 交 换 机 是 第 三 层 的 分 组 交换 机 ， 而 路 由 器 是 第 三 层 的 分 组 交换 机 。 
然而 ， 回 顾 我 们 在 4. 4 节 申 所 学 习 的 内 容 ， 使 用 “匹配 加 动作 ”的 现代 交换 机 能 够 转发 基 
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于 帧 的 目的 MAC 地 址 的 第 二 层 帧 ， 也 能 转发 使 用 数据 报 目的 IP 地 址 的 第 三 层 数 据 报 。 我 
们 的 确 看 到 了 使 用 OpenFlow 标准 的 交换 机 能 够 基于 11 个 不 同 的 帧 、 数 据 报 和 运输 层 首 部 
字段 ， 执 行 通用 的 分 组 转发 。 

即使 交换 机 和 路 由 器 从 根本 上 是 不 同 的， 网 络 管理 员 在 安装 互联 设备 时 也 经 常 必须 在 
它们 之 间 进 行 选择 。 例 如 ， 对 于 图 6-15 中 的 网 络 ， 网 络 管理 员 本 来 可 以 很 容易 地 使 用 路 
由 器 而 不 是 交换 机 来 互联 各 个 系 的 局 域 网 、 服 务 器 和 互联 网 网 关 路 由 器 。 路 由 器 的 确 使 得 
各 系 之 间 通 信 而 不 产生 碰撞 。 既 然 交 换 机 和 路 由 器 都 是 候选 的 互联 设备 ， 那 么 这 两 种 方式 
的 优点 和 缺点 各 是 什么 呢 ? 

首先 考虑 交换 机 的 优点 和 缺点 。 如 上 面 提 到 的 那样 ， 交 换 机 是 即 插 即 用 的 ， 这 是 世界 
上 所 有 超 负 荷 工作 的 网 络 管理 员 都 喜爱 的 特性 。 交 换 机 还 能 够 具有 相对 高 的 分 组 过 滤 和 转 
发 速率 ， 就 像 图 6-24 中 所 示 的 那样 ， 交 换 机 必须 处 理 高 至 第 二 层 的 帧 ， 而 路 由 器 必须 处 
理 高 至 第 三 层 的 数据 报 。 在 男 一 方面 ,为 了 防止 广播 帧 的 循环 ， 交 换 网 络 的 活跃 拓扑 限制 
为 一 棵 生成 树 。 另 外 ， 一 个 大 型 交换 网 络 将 要 求 在 主机 和 路 由 器 中 有 大 的 ARP 表 ， 这 将 
生成 可 观 的 ARP 流量 和 处 理 量 。 而 且 ， 交 换 机 对 于 广播 风暴 并 不 提供 任何 保护 措施 ， 即 
如 果 某 主机 出 了 故障 并 传输 出 没完 没 了 的 以 太 网 广播 帧 流 ， 该 交换 机 将 转发 所 有 这 些 帧 ， 
使 得 整个 以 太 网 的 崩溃 。 i 


主机 主机 





图 6-24 在 交换 机 、 路 由 器 和 主机 中 分 组 的 处 理 


现在 考虑 路 由 器 的 优点 和 缺点。 因为 网 络 寻 址 通常 是 分 层次 的 (TR MAC 寻 址 那样 
是 扁平 的 ) ， 即 使 当 网 络 中 存在 宛 余 路 径 时 ， 分 组 通常 也 不 会 通过 路 由 器 循环 。( 然 而 ， 当 
路 由 器 表 被 误 配置 时 ， 分 组 可 能 循环 ; 但 是 如 我 们 在 第 4 章 所 知 ，IP 用 一 个 特殊 的 报 文 首 
部 字段 来 限制 循环 。) 所 以 ， 分 组 就 不 会 被 限制 到 一 棵 生成 树 上 ， 并 可 以 使 用 源 和 目的 地 
之 间 的 最 佳 路 径 。 因 为 路 由 器 没有 生成 树 限制 ， 所 以 它们 允许 以 丰富 的 拓扑 结构 构建 因 特 
网 ， 例 如 包括 欧洲 和 北美 之 间 的 多 条 活跃 链 路 。 路 由 器 的 另 一 个 特色 是 它们 对 第 二 层 的 广 
播 风 暴 提供 了 防火 墙 保护 。 尽 管 也 许 路 由 器 最 重要 的 缺点 就 是 它们 不 是 即 插 即 用 的 ， 即 路 
由 器 和 连接 到 它们 的 主机 都 需要 人 为 地 配置 下 地址 。 而 且 路 由 器 对 每 个 分 组 的 处 理 时 间 
通常 比 交 换 机 更 长 ， 因 为 它们 必须 处 理 高 达 第 三 层 的 字段 。 最 后 ， 路 由 器 一 词 有 两 种 不 同 
的 发 音 方法 ， 或 者 发 音 为 “rootor” 或 发 音 为 “rowter”， 人 们 浪费 了 许多 时 间 争 论 正确 的 
发 音 | Perlman 1999 |。 

给 出 了 交换 机 和 路 由 器 各 自 具有 的 优点 ZEL 流行 的 互联 设备 的 典型 特色 的 比较 _ 


和 缺点 后 ( 总结 在 表 6-1 中 ) ， 一 个 机 构 的 ae Oe 
网 络 ( 例 如， 大 学 校园 网 或 者 公司 园区 网 ) mem k 


什么 时 候 应 该 使 用 交换 机 ， 什 么 时 候 应 该 使 优化 路 由 无 有 无 
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用 路 由 器 呢 ? 通 常 ， 由 几 百 台 主 机 组 成 的 小 网 络 通 常 有 几 个 局 域 网 网 段 。 对 于 这 些小 网 
络 ， 交 换 机 就 足够 了 ， 因 为 它们 不 要 求 UP 地 址 的 任何 配置 就 能 使 流量 局 部 化 并 增加 总 计 
吞吐 量 。 但 是 在 由 几 千 台 主 机 组 成 的 更 大 网 络 中 ,通常 在 网 络 中 (除了 交换 机 之 外 ) 还 包 
括 路 由 器 。 路 由 器 提供 了 更 健壮 的 流量 隔离 方式 和 对 广播 风暴 的 控制 ， 并 在 网 络 的 主机 之 
间 使 用 更 “智能 的 ”路 由 。 

对 于 交换 网 络 和 路 由 网 络 的 优 缺 点 的 进一步 讨论 ， 以 及 如 何 能 够 将 交换 局 域 网 技术 扩 
展 为 比 今天 的 以 太 网 容纳 多 两 个 数量 级 以 上 的 主机 ， 参 见 [Meyers 2004; Kim 2008], 


6.4.4 虚拟 局 域 网 


在 前 面 图 6-15 的 讨论 中 ， 我 们 注意 到 现代 机 构 的 局 域 网 常常 是 配置 为 等 级 结构 的 ， 
每 个 工作 组 〈 部 门 ) 有 自己 的 交换 局 域 网 ， 经 过 一 个 交换 机 等 级 结构 与 其 他 工作 组 的 交换 
局 域 网 互联 。 虽 然 这 样 的 配置 在 理想 世界 中 能 够 很 好 地 工作 ， 但 在 现实 世界 常常 不 尽 如 人 
意 。 在 图 6-15 中 的 配置 中 ， 能 够 发 现 3 个 缺点 : 
e 缺乏 流量 隔离 。 尽 管 该 等 级 结构 把 组 流量 局 域 化 到 一 个 单一 交换 机 中 ， 但 广播 流 
量 (例如 携带 ARP 和 DHCP 报 文 或 那些 目的 地 还 没有 被 自学 习 交 换 机 学 习 到 的 
W) 仍然 必须 跨越 整个 机 构 网 络 。 限 制 这 些 广播 流量 的 范围 将 改善 局 域 网 的 性 能 。 
也 许 更 为 重要 的 是 ， 为 了 安全 /隐私 的 目的 也 可 能 希望 限制 局 域 网 广播 流量 。 例 
如 ， 如 果 一 个 组 包括 公司 的 行政 管理 团队 ， 另 一 个 组 包括 运行 着 Wireshark 分 组 嗅 
探 器 的 心怀 不 满 的 雇员 ， 网 络 管理 员 也 许 非常 希望 行政 流量 无 法 到 达 该 雇员 的 主 
机 。 通 过 用 路 由 器 代替 图 6-15 中 的 中 心 交 换 机 ， 能 够 提供 这 种 类 型 的 隔离 。 我 们 
很 快 看 到 这 种 隔离 也 能 够 经 过 一 种 交换 (第 二 层 ) 解决 方案 来 取得 。 

© 交换 机 的 无 效 使 用 。 如 果 该 机 构 不 止 有 3 个 组 ， 而 是 有 10 个 组 ， 则 将 要 求 有 10 
个 第 一 级 交换 机 。 如 果 每 个 组 都 较 小 ， 比 如 说 少 于 10 个 人 ， 则 单 台 96 端口 的 交 
换 机 将 足以 容纳 每 个 人 ， 但 这 人 台 单 一 的 交换 机 将 不 能 提供 流量 隔离 。 

e 管理 用 户 。 如 果 一 个 雇员 在 不 同 组 间 移 动 ， 必 须 改变 物理 布线 ， 以 将 该 雇员 连接 
到 图 6-15 中 的 不 同 的 交换 机 上 。 属 于 两 个 组 的 雇员 将 使 问题 更 为 困难 。 

幸运 的 是 ， 这 些 难 题 中 的 每 个 都 能 够 通过 支持 虚拟 局 域 网 (Virtula Local Network, 
VLAN) 的 交换 机 来 处 理 。 顾 名 思 义 ， 支 持 VLAN 的 交换 机 人 允许 经 一 个 单一 的 物理 局 域 网 
基础 设施 定义 多 个 虚拟 局 域 网 。 在 一 个 VLAN 内 的 主机 彼此 通信 ， 仿佛 它们 (并 且 没 有 其 
他 主机 ) 与 交换 机 连接 。 在 一 个 基于 端口 的 VLAN 中 ,交换 机 的 端口 (接口 ) 由 网 络 管 
理 员 划分 为 组 。 每 个 组 构成 一 个 VLAN， 在 每 个 VLAN 中 的 端口 形成 一 个 三 播 域 〈 即 来 自 

一 个 端口 的 广播 流量 仅 能 到 达 该 组 中 的 其 他 
端口 ) 。 图 6-25 显示 了 具有 16 个 端口 的 单 
一 交换 机 。 端 口 2 ~8 属于 电气 工程 系 
(EE) VLAN, ， 而 端口 9 ~15 属于 计算 机 科学 
系 (CS) VLAN (端口 1 和 16 未 分 配 )。 这 
个 VLAN 解决 了 上 面 提 到 的 所 有 困难 ， 即 
EE VLAN 帧 和 CS VLAN 帧 彼此 隔离 ， 图 6- G Ee ee es aCe 
15 中 的 两 台 交 换 机 已 由 一 台 交 换 机 替代 ， 并 电气 工程 系 计算 机 科学 系 
且 在 交换 机 端口 8 的 用 户 加 入 计算 机 科学 系 CE LAR = ts) 
时 ， 网 络 操作 员 只 需 重新 配置 VLAN 软件 ， 图 6-25 “配置 了 两 个 VLAN 的 单 台 交换 机 
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使 得 端口 8 与 CS VLAN 相关 联 即 可 。 人 们 容易 想象 到 VLAN 交换 机 配置 和 操作 的 方法 ， 
即 网 络 管理 员 使 用 交换 机 管理 软件 声明 一 个 端口 属于 某 个 给 定 的 VLAN (其 中 未 声明 的 端 
口 属于 一 个 默认 的 VLAN) ， 在 交换 机 中 维护 一 张 端口 到 VLAN 的 映射 表 ; 交换 机 软件 仅 
在 属于 相同 VLAN 的 端口 之 间 交 付 帧 。 

但 完全 隔离 两 个 VLAN 带 来 了 新 的 困难 ! 来 自 电 子 工程 系 的 流量 怎样 才能 发 送 到 计算 
机 科学 系 呢 ? 解决 这 个 问题 的 一 种 方式 是 将 VLAN 交换 机 的 一 个 端口 (例如 在 图 6-25 中 
的 端口 1) 与 一 台 外 部 的 路 由 器 相连 ， 并 且 将 该 端口 配置 为 属于 EE VLAN 和 CS VLAN, 
在 此 情况 下 ， 即 使 电子 工程 系 和 计算 机 科学 系 共享 相同 的 物理 交换 机 ， 其 逻辑 配置 看 起 来 
也 仿佛 是 电子 工程 系 和 计算 机 科学 系 具 有 分 离 的 经 路 由 器 连接 的 交换 机 。 从 电子 工程 系 发 
往 计算 机 科学 系 的 数据 报 将 首先 跨越 EE VLAN 到 达 路 由 器 ， 然 后 由 该 路 由 器 转发 跨越 CS 
VLAN 到 达 CS 主机 。 幸 运 的 是 交换 机 厂商 使 这 种 配置 变 得 容易 ， 网 络 管理 员 通过 构建 包 
含 一 台 VLAN 交换 机 和 一 台 路 由 器 的 单一 设备 ， 这 样 就 不 再 需要 分 离 的 外 部 路 由 器 了 。 本 
章 后 面 的 课 后 习题 中 更 为 详细 地 探讨 了 这 种 情况 。 

再 次 返回 到 图 6-15 ， 我 们 现在 假设 计算 机 工程 系 没 有 分 离开 来 ， 某 些 电 子 工 程 和 计算 
机 科学 教职员 工 位 于 一 座 建 筑 物 中 ， 他 们 当然 需要 网 络 接 人 ， 并 且 他 们 和 希望 成 为 他 们 系 
VLAN 的 一 部 分 。 图 6-26 显示 了 第 二 台 8 端口 交换 机 ， 其 中 交换 机 端口 已 经 根据 需要 定义 
为 属于 EE VLAN 或 CS VLAN。 但 是 这 两 台 交 换 机 应 当 如 何 互联 呢 ? 一 种 容易 的 解决 方案 
是 在 每 台 交 换 机 上 定义 一 个 属于 CS VALN 的 端口 (对 EE VLAN 也 类 似 处 理 ) ， 并 且 如 
图 6-26a 所 示 将 这 两 个 端口 彼此 互联 起 来 。 然 而 ， 这 种 解决 方案 不 具有 扩展 性 ， 因 为 在 每 
台 交 换 机 上 N 个 VLAN 将 要 求 入 个 端口 直接 互联 这 两 台 交 换 机 。 
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电气 工程 系 计算 机 科学 系 电气 工程 系 计算 机 科学 系 


CVLAN 端口 2~ 8) (VLAN 端 口 9~15) (VLAN 端口 2、3、6) = CVLANSWFI4. 5,7) 
b) FR 


6-26 ”连接 具有 两 个 VLAN 的 两 台 VLAN 交换 机 


一 种 更 具 扩 展 性 互联 VLAN 交换 机 的 方法 称 为 VLAN 干线 连接 ( VLAN trunking)。 在 
图 6-26b 所 示 的 VLAN 干线 方法 中 ， 每 台 交换 机 上 的 一 个 特殊 端口 〈 左 侧 交换 机 上 的 端口 
16， 右 侧 交 换 机 上 的 端口 1) 被 配置 为 干线 端口 ， 以 互联 这 两 台 VLAN 交换 机 。 该 干线 端 
口 属于 所 有 VLAN ， 发 送 到 任何 VLAN 的 帧 经 过 干线 链 路 转发 到 其 他 交换 机 。 但 这 会 引起 
另外 的 问题 : 一 个 交换 机 怎样 知道 到 达 干 线 端口 的 帧 属于 某 个 特定 的 VLAN WE? IEEE 定 
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义 了 一 种 扩展 的 以 太 网 帧 格式 一 一 802. 1Q ， 用 于 跨越 VLAN 于 线 的 帧 。 如 图 6-27 中 所 示 ， 
802. 1Q 帧 由 标准 以 太 网 帧 与 加 进 首 部 的 4 字 节 VLAN 标签 (VLAN tag) 组 成 ， 而 VLAN 
标签 承载 着 该 帧 所 属 的 VLAN 标识 符 。VLAN 标签 由 在 VLAN 干线 发 送 侧 的 交换 机 加 进 帧 
中 ,解析 后 并 由 在 VLAN 干线 接收 侧 的 交换 机 删除 。VLAN 标签 自身 由 一 个 2 字 节 的 标签 
协议 标识 符 (Tag Protocol Identifier，TPID) 字段 (具有 固定 的 十 六 进 制 值 81-00) 、 一 个 2 
字 节 的 标签 控制 信息 字段 (包含 一 个 12 比特 的 VLAN 标识 符 字段 ) 和 一 个 3 比特 优先 权 
字段 (具有 类 似 于 IP 数据 报 TOS 字段 的 目的 ) 组 成 。 


类 型 
前 序 码 。。 目的 地 址 源 地 址 数据 T orc 
1 “、、、 类 型 
| = as | om 
ae cs 数据 CRG， 
[标签 控制 信息 。 
Po at 


图 6-27 初始 的 以 太 网 帧 (上部) ，802. 10 标签 以 太 网 VLAN 帧 (下 部 ) 


在 这 部 分 讨论 中 ， 我 们 仅仅 简要 地 涉及 了 VLAN， 关 注 了 基于 端口 的 VLAN。 我 们 也 
应 当 提 及 VLAN 能 够 以 几 种 其 他 方式 定义 。 在 基于 MAC 的 VLAN 中 ， 网 络 管理 员 指 定 属 
于 每 个 VLAN 的 MAC 地 址 的 集合 ; 无 论 何 时 一 个 设备 与 一 个 端口 连接 时 ， 端 口 基 于 设备 
的 MAC 地 址 将 其 连接 进 适当 的 VLAN. VLAN 也 能 基于 网 络 层 协议 〈 例 如 IPv4, IPv6 或 
Appletalk) 和 其 他 准则 进行 定义 。VLAN 跨越 IP 路 由 器 扩展 也 是 可 能 的 ， 这 使 得 多 个 LAN 
孤岛 能 被 连接 在 一 起 ， 以 形成 能 够 跨越 全 局 的 单一 LAN [Yu 2011 ] 。 详 情 请 参见 802. 1Q 
标准 [IEEE 802. 1q 2005 | 。 


6.5 链 路 虚拟 化 : 网 络 作为 链 路 层 


因为 本 章 关注 链 路 层 协议 ， 所 以 在 我 们 临近 该 章 结束 的 时 候 ， 让 我 们 反思 一 下 对 已 经 
演化 的 词汇 链 路 的 理解 。 在 本 章 开 始 时 ， 我 们 将 链 路 视 为 连接 两 台 通 信 主 机 的 物理 线路 。 
在 学 习 多 路 访问 协议 时 ， 我 们 看 到 了 多 台 主 机 能 够 通过 一 条 共享 的 线路 连接 起 来 ， 并 且 连 
接 主 机 的 这 种 “线路 ”能 够 是 无 线 电 频谱 或 其 他 媒体 。 这 使 我 们 将 该 链 路 更 多 地 抽象 为 一 
条 信道 ， 而 不 是 作为 一 条 线路 。 在 我 们 学 习 以 太 局 域 网 时 (图 6-15)， 我 们 看 到 互联 媒体 
实际 上 能 够 是 一 种 相当 复杂 的 交换 基础 设施 。 然 而 ， 经 过 这 种 演化 ， 主 机 本 身 维持 着 这 样 
的 视图 ， 即 互联 媒体 只 是 连接 两 台 或 多 台 主 机 的 链 路 层 信 道 。 我 们 看 到 ， 例 如 一 台 以 太 网 
主机 不 知道 它 是 通过 单一 短 局 域 网 网 段 (图 6-17 ) 还 是 通过 地 理 上 分 布 的 交换 局 域 网 
(图 6-15) 或 通过 VLAN 与 其 他 局 域 网 主机 进行 连接 ， 这 是 很 幸福 的 事 。 

在 两 台 主 机 之 间 由 拨号 调制 解 调 器 连接 的 场合 ， 连 接 这 两 台 主 机 的 链 路 实际 上 是 电话 
网 ， 这 是 一 个 逻辑 上 分 离 的 、 全 球 性 的 电信 网 络 ， 它 有 自己 的 用 于 数据 传输 和 信 令 的 交换 
机 、 链 路 和 协议 栈 。 然 而 ， 从 因特网 链 路 层 的 观点 看 ， 通 过 电话 网 的 拨号 连接 被 看 作 一 根 
简单 的 “线路 " 。 在 这 个 意义 上 上， 因特网 虚拟 化 了 电话 网 ， 将 电话 网 看 成 为 两 台 因特网 主 
机 之 间 提 供 链 路 层 连 接 的 链 路 层 技术 。 你 可 能 回想 起 在 第 2 章 中 对 于 覆盖 网 络 的 讨论 ， 类 
似 地 ， 一 个 覆盖 网 络 将 因特网 视 为 为 覆盖 节点 之 间 提 供 连 接 性 的 一 种 手段 ， 寻 求 以 因特网 
覆盖 电话 网 的 相同 方式 来 覆盖 因特网 。 
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在 本 节 中 ， 我 们 将 考虑 多 协议 标签 交换 (MPLS) 网 络 。 与 电路 交换 的 电话 网 不 同 ， 
MPLS 客观 上 讲 是 一 种 分 组 交换 的 虚 电路 网 络 。 它 们 有 自己 的 分 组 格式 和 转发 行为 。 因 此 ， 
从 教学 法 的 观点 看 ， 有 关 MPLS 的 讨论 既 适 合 放 在 网 络 层 的 学 习 中 ， 也 适合 放 在 链 路 层 的 
学 习 中 。 然 而 ， 从 因特网 的 观点 看 ， 我 们 能 够 认为 MPLS 像 电话 网 和 交换 以 太 网 一 样 ， 作 
AA IP 设备 提供 互联 服务 的 链 路 层 技术 。 因 此 ， 我 们 将 在 链 路 层 讨论 中 考虑 MPLS。 帧 中 
继 和 ATM 网 络 也 能 用 于 互联 王 设备 ， 虽 然 这 些 技 术 看 上 去 有 些 过 时 〈 但 仍 在 部 署 ) ， 这 
里 将 不 再 讨论 ; 详情 请 参见 一 本 可 读 性 强 的 书 [ Goralski 1999 ] 。 我 们 对 MPLS 的 讨论 将 是 
简明 扼要 的 ， 因 为 有 关 这 些 网 络 每 个 都 能 够 写 (并 且 已 经 写 了 ) 整 本 书 。 有 关 MPLS 详情 
我 们 推荐 [Davie 2000 ] 。 我 们 这 里 主要 关注 这 些 网 络 怎样 为 互联 人 P 设备 提供 服务 ， 尽 管 
我 们 也 将 更 深入 一 些 探讨 支撑 基础 技术 。 


多 协议 标签 交换 


多 协议 标签 交换 (Multiprotocol Label Switching, MPLS) 自 20 世纪 90 年 代 中 后 期 在 一 
些 产 业界 的 努力 下 进行 演化 ， 以 改善 IP 路 由 器 的 转发 速度 。 它 采用 来 自 虚 电 路 网 络 领 域 
的 一 个 关键 概念 : 固定 长 度 标签 。 其 目标 是 : 对 于 基于 固定 长 度 标签 和 虚 电 路 的 技术 ， 在 
不 放弃 基于 目的 地 卫 数据 报 转 发 的 基础 设施 的 前 提 下 ， 当 可 能 时 通过 选择 性 地 标识 数据 
报 并 人 允许 路 由 器 基于 固定 长 度 的 标签 〈 而 不 是 目的 地 IP 地 址 ) 转发 数据 报 来 增强 其 功能 。 
重要 的 是 ， 这 些 技术 与 IP 协同 工作 ， 使 用 IP 寻 址 和 路 由 选择 。IETF 在 MPLS 协议 中 统一 
了 这 些 努力 [RFC 3031; RFC 3032], ， 有 效 地 将 虚 电 路 (VC) 技术 综合 进 了 路 由 选择 的 
数据 报 网 络 。 

首先 考虑 由 MPLS 使 能 的 路 由 器 处 理 的 链 路 层 帧 格式 ， 以 此 开始 学 习 MPLS。 图 6-28 
显示 了 在 MPLS 使 能 的 路 由 器 之 间 传 输 的 一 个 链 路 层 帧 ， 该 帧 具有 一 个 小 的 MPLS 首部 ， 
该 首部 增加 到 第 二 层 (如 以 太 网 ) 首部 和 第 三 层 (BIP) 首部 之 间 。RFC 3032 定义 了 用 
于 这 种 链 路 的 MPLS 首部 的 格式 ; 用 于 ATM 和 帧 中 继 网 络 的 首部 也 定义 在 其 他 的 RFC 文 
档 中 。 包 括 在 MPLS 首部 中 的 字段 是 : ME; 预 留 的 3 比特 实验 字段 ; 1 比特 S FR, H 
于 指示 一 系列 “ es 的 MPLS eiai ee 寿命 字段 。 








6-28 MPLS 首部 : 位 于 链 路 层 和 网 络 层 首 部 之 间 


从 图 6-28 立即 能 够 看 出 ， 一 个 MPLS 加 强 的 帧 仅 能 在 两 个 均 为 MPLS 使 能 的 路 由 器 之 
间 发 送 。( 因为 一 个 非 MPLS 使 能 的 路 由 器 ， 当 它 在 期 望 发 现 全 首部 的 地 方 发 现 了 一 
MPLS 首部 时 会 相当 混淆 !) 一 个 MPLS 使 能 的 路 由 器 常 被 称 为 标签 交换 路 由 器 ( label- 
switched router) ， 因 为 它 通 过 在 其 转发 表 中 查找 MPLS 标签 ， 然 后 立即 将 数据 报 传递 给 适 
当 的 输出 接口 来 转发 MPLS 帧 。 因 此 ，MPLS 使 能 的 路 由 器 不 需要 提取 目的 IP 地址 和 在 转 
发 表 中 执行 最 长 前 级 匹配 的 查找 。 但 是 路 由 器 怎样 才能 知道 它 的 邻居 是 否 的 确 是 MPLS 使 
能 的 呢 ? 路 由 器 如 何 知 道 哪个 标签 与 给 定 IP 目的 地 相 联系 呢 ? 为 了 回答 这 些 问 题 ， 我 们 
需要 看 看 一 组 MPLS 使 能 路 由 器 之 间 的 交互 过 程 。 

在 图 6-29 所 示 的 例子 中 ， 路 由 器 R1 到 R4 都 是 MPLS 使 能 的 ，R5 和 RO 是 标准 的 IP 
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路 由 器 。R1 向 R2 和 R3 通告 了 它 (R1) 能 够 路 由 到 目的 地 A， 并 且 具 有 MPLS 标签 6 的 
接收 帧 将 要 转发 到 目的 地 A。 路 由 器 R3 已 经 向 路 由 器 R4 通告 了 它 能 够 路 由 到 目的 地 A 和 
D, 分 别 具 有 MPLS 标签 10 和 12 的 入 帧 将 朝 着 这 些 目 的 地 交换 。 路 由 器 R2 也 向 路 由 器 
R4 通告 了 它 (R2) 能 够 到 达 目 的 地 A， 具 有 MPLS 标签 8 的 接收 帧 将 朝 着 A 交换 。 注 意 
到 路 由 器 R4 现在 处 于 一 个 到 达 A 且 有 两 个 MPLS 路 径 的 令 人 感 兴趣 的 位 置 上 ， 经 接口 0 
具有 出 MPLS 标签 10 ， 经 接口 1 具有 出 MPLS 标签 8。 在 图 6-29 中 画 出 的 外 围 部 分 是 全 设 
备 R5、R6、A 和 D， 它 们 经 过 一 个 MPLS 基础 设施 (MPLS 使 能 路 由 器 RI, R2, R3 和 
R4) 连接 在 一 起 ， 这 与 一 个 交换 局 域 网 或 ATM 网 络 能 够 将 IP 设备 连接 到 一 起 的 方式 十 分 
相似 。 并 且 与 交换 局 域 网 或 ATM 网 络 相似 ，MPLS 使 能 路 由 器 R1 到 R4 完成 这 些 工作 时 


从 没有 接触 分 组 的 卫 首 部 。 
A 
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图 6-29 MPLS 增强 的 转发 


在 我 们 上 面 的 讨论 中 ， 我们 并 没有 指定 在 MPLS 使 能 路 由 器 之 间 分 布 标签 的 特定 协 
议 ， 因 为 该 信 令 的 细节 已 经 超出 了 本 书 的 范围 。 然 而 ， 我 们 注意 到 ，IETF 的 MPLS 工作 组 
已 经 在 [RFC 3468] 中 定义 了 RSVP 协议 的 一 种 扩展 ， 称 之 为 RSVP-TE[ RFC 3209]， 它 
将 关注 对 MPLS 信 令 所 做 的 工作 。 我 们 也 不 讨论 MPLS 实际 上 是 如 何 计算 在 MPLS 使 能 路 
由 器 之 间 分 组 的 路 径 的 ， 也 不 讨论 它 如 何 收集 链 路 状态 信息 〈 例 如 ， 未 由 MPLS 预 留 的 链 
路 带宽 量 ) 以 用 于 这 些 路 径 计 算 中 。 现 有 的 链 路 状态 路 由 选择 算法 〈 例 如 OSPF) BAT 
展 为 向 MPLS 使 能 路 由 器 “ 洪 泛 ”。 令 人 感 兴趣 的 是 ， 实 际 路 径 计算 算法 没有 标准 化 ， 它 
们 当前 是 厂商 特定 的 算法 。 

至 今 为 止 ， 我 们 关于 MPLS 的 讨论 重点 基于 这 样 的 事实 ，MPLS 基于 标签 执行 交换 ， 
而 不 必 考 虑 分 组 的 卫 地 址 。 然 而 ，MPLS 的 真正 优点 和 当前 对 MPLS 感 兴趣 的 原因 并 不 在 
于 交换 速度 的 潜在 增加 ， 而 在 于 MPLS 使 能 的 新 的 流量 管理 能 力 。 如 前 面 所 述 ，R4 到 A 
具有 两 条 MPLS 路 径 。 如 果 转 发 在 IP 层 基 于 IP 地 址 执行 ,我 们 在 第 4 章 中 学 习 的 正路 由 
选择 协议 将 只 指定 到 A 的 单一 最 小 费用 的 路 径 。 所 以 ，MPLS 提供 了 沿 着 多 条 路 由 转发 分 
组 的 能 力 ， 使 用 标准 正路 由 选择 协议 这 些 路 由 将 是 不 可 能 的 。 这 是 使 用 MPLS 的 一 种 简单 
形式 的 流量 工程 (traffic engineering)[ RFC 3346; RFC3272; RFC 2702; Xiao 2000] ， 其 中 
网 络 运 行者 能 够 超越 普通 的 卫 路 由 选择 ， 迫 使 某 些 流量 沿 着 一 条 路 径 朝 着 某 给 定 的 目的 
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地 引导 ， 并 且 朝 着 相同 目的 地 的 其 他 流量 沿 着 另 一 条 路 径流 动 (无 论 是 由 于 策略 、 性 能 或 
某 些 其 他 原因 ) 。 

将 MPLS 用 于 其 他 目的 也 是 可 能 的 。 能 用 于 执行 MPLS 转发 路 径 的 快速 恢复 ， 例 如 ， 
经 过 一 条 预计 算 的 无 故障 路 径 重 路 由 流量 来 对 链 路 故障 做 出 反应 [Kar 2000; Huang 2002; 
RFC 3469] 。 最 后 ， 我 们 注意 到 MPLS 能 够 并 且 已 经 被 用 于 实现 所 谓 虚 拟 专用 网 (Virtual 
Private Network ，VPN ) 。 在 为 用 户 实现 一 个 VPNR 的 过 程 中 ，ISP 使 用 它 的 MPLS 使 能 网 络 
将 用 户 的 各 种 网 络 连接 在 一 起 。MPLS 能 被 用 于 将 资源 和 由 用 户 的 VPN 使 用 的 寻 址 方式 相 
隔离 ， 其 他 用 户 利 用 该 VPN 跨越 该 ISP 网 络 ， 详 情 参 见 [DeClercq 2002 ] 。 

这 里 有 关 MPLS 的 讨论 是 简要 的 ， 我们 鼓励 读者 查阅 我 们 提 到 的 这 些 文献 。 我 们 注意 
到 对 MPLS 有 许多 可 能 的 用 途 ， 看 起 来 它 将 迅速 成 为 因特网 流量 工程 的 瑞士 军刀 ! 


6.6 数据 中 心 网 络 


近年 来 ， 因 特 网 公司 如 谷歌 、 微 软 、 脸 书 (Facebook) 和 亚马逊 (以 及 它们 在 亚洲 和 
欧洲 的 同行 ) 已 经 构建 了 大 量 的 数据 中 心 。 每 个 数据 中 心 都 容纳 了 数 万 至 数 十 万 台 主 机 ， 
并 且 同 时 支持 着 很 多 不 同 的 云 应 用 〈 例 如 搜索 、 电 子 邮件 、 社 交 网 络 和 电子 商务 ) 。 每 个 
数据 中 心 都 有 自己 的 数据 中 心 网 络 (data center network) ， 这 些 数据 中 心 网 络 将 其 内 部 主 
机 彼此 互联 并 与 因特网 中 的 数据 中 心 互联 。 在 本 节 中 ， 我 们 简要 介绍 用 于 云 应 用 的 数据 中 
心 网 络 。 

大 型 数据 中 心 的 投资 巨大 ， 一 个 有 100 000 台 主 机 的 数据 中 心 每 个 月 的 费用 超过 1200 
万 美元 [Greenberg 2009a] 。 在 该 费用 中 ， 用 于 主机 自身 的 开销 占 45% (每 3 ~4 年 需要 更 
新 一 次 ) ; 变压器 、 不 间断 电源 系统 、 长 时 间断 电 时 使 用 的 发 电机 以 及 冷却 系统 等 基础 设 
施 的 开销 占 25% ; 用 于 功 耗 的 电力 设施 的 开销 占 15% ; 用 于 联网 的 开销 占 15% ， 这 包括 
了 网 络 设备 (交换 机 、 路 由 器 和 负载 均衡 设备 ) 、 外 部 链 路 以 及 传输 流量 的 开销 。 (在 这 
些 比例 中 ， 设 备 费用 是 分 期 偿还 的 ， 因 此 费用 通常 是 由 一 次 性 购买 和 持续 开销 ( 如 能 耗 ) 
构成 的 。) 尽管 联网 不 是 最 大 的 费用 ， 但 是 网 络 创 新 是 减少 整体 成 本 和 性 能 最 大 化 的 关键 
[ Greenberg 2009a | 。 

主机 就 像 是 数据 中 心 的 工蜂 : 它们 负责 提供 内 容 〈 例 如 ， 网 页 和 视频 ) ， 存 储 邮 件 和 
文档 ， 并 共同 执行 大 规模 分 布 式 计算 (例如 ， 为 搜索 引擎 提供 分 布 式 索引 计算 )。 数 据 中 
心中 的 主机 称 为 刀片 (blade) ， 与 比萨 饼 盒 类 似 ， 一 般 是 包括 CPU、 内 存 和 磁盘 存储 的 商 
用 主机 。 主 机 被 堆 释 在 机 架 上 ， 每 个 机 架 一 般 堆 放 20 ~ 40 台 刀 片 。 在 每 一 个 机 架 顶 部 有 
一 台 交 换 机 ， 这 人 台 交 换 机 被 形象 地 称 为 机 架 顶 部 (Top of Rack, TOR) 交换 机 ， 它 们 与 机 
架 上 的 主机 互联 ， 并 与 数据 中 心中 的 其 他 交换 机 互联 。 具 体 来 说 ， 机 架 上 的 每 台 主 机 都 有 
一 块 与 TOR 交换 机 连接 的 网 卡 ， 每 台 TOR 交换 机 有 和 额外 的 端口 能 够 与 其 他 TOR 交换 机 连 
接 。 目 前 主机 通常 用 40Gbps 的 以 太 网 连接 到 它们 的 TOR 交换 机 [Greenberg 2015 ] 。 每 台 
主机 也 会 分 配 一 个 自己 的 数据 中 心 内 部 的 IP 地 址 。 

数据 中 心 网 络 支 持 两 种 类 型 的 流量 : 在 外 部 客户 与 内 部 主机 之 间 流 动 的 流量 ， 以 及 内 
部 主机 之 间 流 动 的 流量 。 为 了 处 理 外 部 客户 与 内 部 主机 之 间 流 动 的 流量 ， 数 据 中 心 网 络 包 
括 了 一 台 或 者 多 台 边 界 路 由 器 (border router) ， 它 们 将 数据 中 心 网 络 与 公共 因特网 相连 。 
数据 中 心 网 络 因此 需要 将 所 有 机 架 彼 此 互联 ， 并 将 机 架 与 边界 路 由 器 连接 。 图 6-30 显示 
了 一 个 数据 中 心 网 络 的 例子 。 数 据 中 心 网 络 设计 (data center network design) 是 互联 网 络 
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和 协议 设计 的 艺术 ， 该 艺术 专注 于 机 架 彼 此 连接 和 与 边界 路 由 器 相连 。 近 年 来 ， 数 据 中 心 
网 络 的 设计 已 经 成 为 计算 机 网 络 研究 的 重要 分 支 [Al-Fares 2008; Greenberg 2009a; 
Greenberg 2009b; Mysore 2009; Guo 2009; Wang 2010]. 





图 6-30 具有 等 级 拓扑 的 数据 中 心 网 络 


1. 负载 均衡 

一 个 云 数据 中 心 ， 如 一 个 谷歌 或 者 微软 的 数据 中 心 ， 能 够 同时 提供 诸如 搜索 、 电 子 邮 
件 和 视频 应 用 等 许多 应 用 。 为 了 支持 来 自 外 部 客户 的 请 求 ， 每 一 个 应 用 都 与 一 个 公开 可 见 
的 TP 地 址 关联 ， 外 部 用 户 向 该 地 址 发 送 其 请 求 并 从 该 地 址 接收 响应 。 在 数据 中 心 内 部 ， 
外 部 请 求 首先 被 定向 到 一 个 负载 均衡 器 (load balancer) 。 负 载 均 衡器 的 任务 是 向 主机 分 发 
请 求 ， 以 主机 当前 的 负载 作为 函数 来 在 主机 之 间 均 衔 负载 。 一 个 大 型 的 数据 中 心 通常 会 有 
几 台 负载 均衡 器 ， 每 台 服 务 于 一 组 特定 的 云 应 用 。 由 于 负载 均衡 器 基于 分 组 的 目的 端口 号 
(第 四 层 ) 以 及 目的 他 地 址 做 决策 ， 因 此 它们 常 被 称 为 “第 四 层 交 换 机 ”。 一旦 接收 到 一 
个 对 于 特定 应 用 程序 的 请 求 ， 负 载 均 衡器 将 该 请 求 分 发 到 处 理 该 应 用 的 某 一 人 台 主 机 上 (该 
主机 可 能 再 调用 其 他 主机 的 服务 来 协助 处 理 该 请 求 ) 。 当 主机 处 理 完 该 请 求 后 ， 向 负载 均 
衡器 回 送 响应 ， 再 由 负载 均衡 器 将 其 中 继 发 回 给 外 部 客户 。 负 载 均 衡器 不 仅 平衡 主机 间 的 
工作 负载 ， 而 且 还 提供 类 似 NAT 的 功能 ， 将 外 部 IP 地 址 转换 为 内 部 适当 主机 的 IP 地 址 ， 
然后 将 反方 向 流向 客户 的 分 组 按照 相反 的 转换 进行 处 理 。 这 防止 客户 直接 接触 主机 ， 从 而 
具有 隐藏 网 络 内 部 结构 和 防止 客户 直接 与 主机 交互 等 安全 性 益处 。 

2. 等 级 体系 结构 

对 于 仅 有 数 千 台 主机 的 小 型 数据 中 心 ， 一 个 简单 的 网 络 也 许 就 足够 了 。 这 种 简单 网 络 
由 一 台 边 界 路 由 器 、 一 台 负 载 均衡 器 和 几 十 个 机 架 组 成 ， 这 些 机 架 由 单一 以 太 网 交换 机 进 
行 互 联 。 但 是 当主 机 规模 扩展 到 几 万 至 几 十 万 的 时 候 ， 数 据 中 心 通常 应 用 路 由 器 和 交换 机 
等 级 结构 (hierarchy of router and switch) ， 图 6-30 显示 了 这 样 的 拓扑 。 在 该 等 级 结构 的 顶 
端 ， 边 界 路 由 器 与 接 和 人 路 由 器 相连 〈 在 图 6-30 中 仅仅 显示 了 两 人 台 , 但 是 能 够 有 更 多 ) 。 在 
每 台 接 和 人 路 由 器 下 面 ， 有 3 层 交 换 机 。 每 台 接 和 人 路 由 器 与 一 台 第 一 层 交 换 机 相连 ， 每 台 
一 层 交 换 机 与 多 台 第 二 层 交 换 机 以 及 一 台 负 载 均 衡器 相连 。 每 台 第 二 层 交 换 机 又 通过 机 架 
的 TOR 交换 机 (第 三 层 交换 机 ) 与 多 个 机 架 相 连 。 所 有 链 路 通常 使 用 以 太 网 作为 链 路 层 


324 OF 








和 物理 层 协议 ， 并 混合 使 用 铜 缆 和 光缆 。 通 过 这 种 等 级 式 设计 ， 可 以 将 数据 中 心 扩展 到 几 
十 万 台 主 机 的 规模 。 

因为 云 应 用 提供 商 持续 地 提供 高 可 用 性 的 应 用 是 至 关 重要 的 ， 所 以 数据 中 心 在 它们 的 
设计 中 也 包含 了 元 余 网 络 设备 和 元 余 链 路 (在 图 6-30 中 没有 显示 出 来 ) 。 例 如 ， 每 台 TOR 
交换 机 能 够 与 两 台 第 二 层 交换 机 相连 ， 每 台 接 入 路 由 器 、 第 一 层 交换 机 和 第 二 层 交换 机 可 
以 元 余 并 集成 到 设计 中 [Cisco 2012; Greenberg 2009b] 。 在 图 6-30 中 的 等 级 设计 可 以 看 
到 ， 每 台 接 人 路 由 器 下 的 这 些 主 机 构成 了 单一 子 网 。 为 了 使 ARP 广播 流量 本 地 化 ， 这 些 
子 网 的 每 个 都 被 进一步 划分 为 更 小 的 VLAN 子 网 ， 每 个 由 数 百 台 主 机 组 成 【 Greenberg 
2009a | 。 

尽管 刚才 描述 的 传统 的 等 级 体系 结构 解决 了 扩展 性 问题 ， 但 是 依然 存在 主机 到 主机 容 
量 受 限 的 问题 【Greenberg 2009b] 。 为 了 理解 这 种 限制 ， 重 新 考虑 图 6-30， 并 且 假 设 每 台 
主机 用 1Gbps 链 路 连接 到 它 的 TOR 交换 机 ， 而 交换 机 间 的 链 路 是 10Gbps 的 以 太 网 链 路 。 
在 相同 机 架 中 的 两 台 主机 总 是 能 够 以 1Gbps 全 速 通 信 ， 而 只 受 限于 主机 网 络 接口 卡 的 束 
率 。 然 而 ， 如 果 在 数据 中 心 网 络 中 同时 存在 多 条 并 发 流 ， 则 不 同 机 架 上 的 两 台 主机 间 的 最 
大 速率 会 小 得 多 。 为 了 深入 理解 这 个 问题 ， 考 虑 不 同 机 架 上 的 40 对 不 同 主机 间 的 40 条 并 
发 流 的 情况 。 具 体 来 说 ， 假 设 图 6-30 中 机 架 1 上 10 台 主机 都 向 机 架 5 上 对 应 的 主机 发 送 
一 条 流 。 类 似 地 ， 在 机 架 2 和 机 架 6 的 主机 对 上 有 10 条 并 发 流 ， 机 架 3 和 机 架 7 间 有 10 
条 并 发 流 ， 机 架 4 和 机 架 8 间 也 有 10 条 并 发 流 。 如 果 每 一 条 流 和 其 他 流 经 同一 条 链 路 的 
流 平均 地 共享 链 路 容量 ， 则 经 过 10Gbps 的 A 到 B 链 路 (以 及 10Gbps 的 B 到 C 链 路 ) 的 
40 条 流 中 每 条 流 获得 的 速率 为 10Gbps/40 =250Mbps， 显 著 小 于 1Gbps 的 网 络 接口 卡 速率 。 
如 果 主机 间 的 流量 需要 穿 过 该 等 级 结构 的 更 高 层 ， 这 个 问题 会 变 得 更 加 严重 。 对 这 个 限制 
的 一 种 可 行 的 解决 方案 是 部 署 更 高 速率 的 交换 机 和 路 由 器 。 但 是 这 会 大 大 增加 数据 中 心 的 
费用 ， 因 为 具有 高 接口 速率 的 交换 机 和 路 由 器 是 非常 昂贵 的 。 

因为 数据 中 心 的 一 个 关键 需求 是 放置 计算 和 服务 的 灵活 性 ， 所 以 支持 主机 到 主机 的 高 
带宽 通信 十 分 重要 [Greenberg 200b; Farrington 2010] 。 例 如 ， 一 个 大 规模 的 因特网 搜索 
引擎 可 能 运行 在 跨越 多 个 机 架 的 上 千 台 主机 上 ， 在 所 有 主机 对 之 间 具 有 极 高 的 带宽 要 求 。 
类 似 地 ， 像 EC2 这 样 的 云 计算 服务 可 能 希望 将 构成 用 户 服务 的 多 台 虚 拟 机 运行 在 具有 最 大 
容量 的 物理 主机 上 ， 而 无 须 考虑 它们 在 数据 中 心 的 位 置 。 如 果 这 些 物 理 主机 跨越 了 多 个 机 
架 ， 前 面 描述 的 网 络 瓶颈 可 能 会 导致 性 能 不 佳 。 

3. 数据 中 心 网 络 的 发 展 趋势 


为 了 降低 数据 中 心 的 费用 ， 同 时 提高 其 在 时 延 和 吞吐 量 上 的 性 能 ， 因 特 网 云 服 务 巨头 
如 谷歌 、 脸 书 、 亚 马 逊 和 微软 都 在 不 断 地 部 署 新 的 数据 中 心 网 络 设计 方案 。 尽 管 这些 设 计 
方案 都 是 专 有 的 ， 但 是 许多 重要 的 趋势 是 一 样 的 。 

其 中 的 一 个 趋势 是 部 署 能 够 克服 传统 等 级 设计 缺陷 的 新 型 互联 体系 结构 和 网 络 协议 。 
一 种 方法 是 采用 全 连接 拓扑 (fully connected topology) 来 替代 交换 机 和 路 由 器 的 等 级 结构 
[ Facebook 2014; Al-Fares 2008; Greenberg 2009b; Guo 2009], 图 6-31 中 显示 了 这 种 拓 
扑 。 在 这 种 设计 中 ， 每 台 第 一 层 交 换 机 都 与 所 有 第 二 层 交 换 机 相连 ， 因 此 : 中 主机 到 主机 
的 流量 绝 不 会 超过 该 交换 机 层次 ; DHF n 台 第 一 层 交换 机 ， 在 任意 两 台 二 层 交 换 机 间 有 
n 条 不 相交 的 路 径 。 这 种 设计 可 以 显著 地 改善 主机 到 主机 的 容量 。 为 了 理解 该 问题 ， 重 新 
考虑 40 条 流 的 例子 。 图 6-31 中 的 拓扑 能 够 处 理 这 种 流 模式 ， 因 为 在 第 1 台 第 二 层 交换 机 


BBE FAIA 325 





和 第 2 台 第 二 层 交 换 机 间 存 在 4 条 不 相交 的 路 径 ， 可 以 一 起 为 前 两 台 第 二 层 交 换 机 之 间 提 
供 总 和 为 40Gbps 的 聚合 容量 。 这 种 设计 不 仅 减轻 了 主机 到 主机 的 容量 限制 ， 同 时 创建 了 
一 种 更 加 灵活 的 计算 和 服务 环境 。 在 这 种 环境 中 ,任何 未 连接 到 同一 台 交 换 机 的 两 个 机 架 
之 间 的 通信 在 逻辑 上 是 等 价 的 ， 而 不 论 其 在 数据 中 心 的 位 置 如 何 。 





图 6-31 高 度 互 联 的 数据 网 络 拓扑 


另外 一 个 主要 的 趋势 就 是 采用 基于 船 运 集装箱 的 模块 化 数据 中 心 ( Modular Data 
Center, MDC) [ You Tube 2009; Waldrop 2007 ] 。 在 一 个 MDC 中 ， 在 一 个 标准 的 12 米 船 
运 集 装 箱 内 ， 工 厂 构 建 一 个 “迷你 数据 中 心 ”并 将 该 集装箱 运送 到 数据 中 心 的 位 置 。 每 
一 个 集装箱 都 有 多 达 数 千 台 主机 ， 堆 放 在 数 十 台 机 架 上 ， 并 且 紧 密 地 排列 在 一 起 。 在 数 
据 中 心 位 置 ， 多 个 集装箱 彼此 互联 ， 同 时 也 和 因特网 连接 。 一旦 预制 的 集装箱 部 署 在 数 
据 中 心 ， 通 常 难以 检修 。 因 此 ， 每 一 个 集装箱 都 得 体 地 设计 为 性 能 下 降 : 当 组 件 ( 服务 
器 和 交换 机 ) 随 着 时 间 的 推移 出 现 故 障 时 ， 集 装 箱 继续 运行 但 是 性 能 下 降 。 当 许多 组 件 
出 现 故障 并 且 性 能 已 经 下 降 到 低 于 某 个 阔 值 时 ， 整 个 集装箱 将 会 被 移 除 ， 并 用 新 的 来 
替换 。 

创建 由 集装箱 构成 的 数据 中 心 提出 了 新 的 联网 挑战 。 对 于 MDC， 有 两 种 类 型 的 网 络 : 
每 一 个 集装箱 中 的 内 部 网 络 和 互联 每 个 集装箱 的 核心 网 络 [ Guo 2009; Farrington 2010] 。 
在 每 个 集装箱 内 部 ， 在 规模 上 升 到 数 千 台 主机 的 时 候 ， 通 过 廉价 的 商用 吉 比 特 以 太 网 交换 
机 创建 全 连接 的 网 络 (如 前 面 所 描述 ) 是 可 行 的 。 然 而 ， 核 心 网 络 的 设计 仍然 是 一 个 带 有 
挑战 性 的 问题 ， 这 需要 能 互联 成 百 上 千 的 集装箱 ， 同 时 能 够 为 典型 工作 负载 提供 跨 多 个 集 
装 箱 的 主机 到 主机 间 的 高 带宽 。 [Farrington 2010] 中 提出 了 一 种 互联 集装箱 的 混合 电 / 光 
交换 机 体系 结构 。 

当 采 用 高 度 互联 拓扑 的 时 候 ， 一 个 主要 的 问题 是 设计 交换 机 之 间 的 路 由 选择 算法 。 一 
种 可 能 是 采用 随机 路 由 选择 方式 | Greenberg 2009b] 。 另 一 种 可 能 是 在 每 台 主 机 中 部 署 多 
块 网 络 接口 卡 [Guo 2009 ] ， 将 每 台 主 机 连接 到 多 台 低 成 本 的 商用 交换 机 上 ， 并 且 人 允许 主 
机 自己 在 交换 机 间 智 能 地 为 流量 选 路 。 这 些 方 案 的 变种 和 扩展 正 被 部 署 在 当前 的 数据 中 
心中 。 

另 一 种 重要 趋势 是 ， 大 型 云 提供 商 正在 其 数据 中 心 越 来 越 多 地 建造 或 定制 几乎 所 有 东 
西 ， 包 括 网 络 适 配器 、 交 换 机 路 由 器 、TOR、 软 件 和 网 络 协议 [ Greenberg 2015; Singh 
2015 ] 。 由 亚马逊 开创 的 另 一 个 趋势 是 ， 用 “可 用 性 区 域 ”来 改善 可 靠 性 ， 这 种 技术 在 不 
同 的 邻近 建筑 物 中 基本 上 复制 不 同 的 数据 中 心 。 通 过 让 建筑 物 邻近 (ULF Ki), AAA 
互 的 数据 能 够 跨越 位 于 相同 可 用 性 区 域 的 数据 中 心 进 行 同 步 ， 与 此 同时 提供 容错 性 [Am- 
azon 2014] 。 数 据 中 心 设计 会 不 断 出 现 更 多 的 创新 ， 感 兴趣 的 读者 可 以 查看 近期 的 论文 和 
有 关 数 据 中 心 设计 的 视频 。 
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6.7 回顾 : Web 页 面 请 求 的 历程 


既然 我 们 已 经 在 本 章 中 学 过 了 链 路 层 ， 并 且 在 前 面 几 章 中 学 过 了 网 络 层 、 运 输 层 和 应 
用 层 ， 那 么 我 们 沿 协议 栈 向 下 的 旅程 就 完成 了 ! 在 本 书 的 一 开始 (1.1 节 )， 我们 说 过 
“本 书 的 大 部 分 内 容 与 计算 机 网 络 协议 有 关 ”， 在 本 章 中 ,我们 无 疑 已 经 看 到 了 情况 的 确 如 
此 ! 在 继续 学 习 本 书 第 二 部 分 中 时 下 关注 的 章节 之 前 ， 通 过 对 已 经 学 过 的 协议 做 一 个 综合 
的 、 全 面 的 展望 ， 我 们 希望 总 结 一 下 沿 协议 栈 向 下 的 旅程 。 而 做 这 个 “全 面 的 ”展望 的 一 
种 方法 是 识别 许多 (许多 !) 协议 ， 这 些 协 议 涉及 满足 甚至 最 简单 的 请 求 : 下 载 一 个 Web 
页 面 。 图 6-32 图 示 了 我 们 的 场景 : 一 名 学 生 Bob 将 他 的 便携 机 与 学 校 的 以 太 网 交换 机 相 
JE, 下 载 一 个 Web 页 面 ( 比如 说 www. google. com 主页 ) 。 如 我 们 所 知 ， 为 满足 这 个 看 起 
来 简单 的 请 求 ， 背 后 隐藏 了 许多 细节 。 本 章 后 面 的 Wireshark 实验 仔细 检查 了 包含 一 些 分 
组 的 踪迹 文件 ， 这 些 分 组 更 为 详细 地 涉及 类 似 的 场景 。 
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图 6-32 Web 页 请 求 的 历程 : 网 络 环境 和 动作 


6.7.1 准备 : DHCP、UDP、IP 和 以 太 网 


我 们 假定 Bob 启动 他 的 便携 机 ， 然 后 将 其 用 一 根 以 太 网 电缆 连接 到 学 校 的 以 太 网 交换 
机 ， 交 换 机 又 与 学 校 的 路 由 器 相连 ， 如 图 6-32 所 示 。 学 校 的 这 人 台 路 由 需 与 一 个 ISP 连接 ， 
本 例 中 ISP 为 comcast. net。 在 本 例 中 ，comcast net 为 学 校 提 供 了 DNS 服务 ; 所 以 ，DNS 
服务 器 驻 留 在 Comcast 网 络 中 而 不 是 学 校 网 络 中 。 我 们 将 假设 DHCP 服务 器 运行 在 路 由 器 
中 ， 就 像 常见 情况 那样 。 

当 Bob 首先 将 其 便携 机 与 网 络 连接 时 ， 没 有 IP 地 址 他 就 不 能 做 任何 事情 (例如 下 载 
一 个 Web 网 页 ) 。 所 以 ，Bob 的 便携 机 所 采取 的 一 个 网 络 相关 的 动作 是 运行 DHCP 协议 ， 
以 从 本 地 DHCP 服务 器 获得 一 个 P 地 址 以 及 其 他 信息 。 

1) Bob 便携 机 上 的 操作 系统 生成 一 个 DHCP 请 求 报 文 (4. 3.3 节 ) ， 并 将 这 个 报 文 放 
入 具有 目的 端口 67 (DHCP 服务 器 ) 和 源 端 口 68 (DHCP 客户 ) 的 UDP 报 文 段 (3.3 节 ) 
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该 UDP 报 文 段 则 被 放置 在 一 个 具有 广播 了 P 目 的 地 址 (255.255.255.255) 和 源 IP 地 址 
0.0.0.0 AY IP 数据 报 中 (4.3.1 节 )， 因 为 Bob 的 便携 机 还 没有 一 个 全 地址 。 

2) 包含 DHCP 请 求 报 文 的 IP 数据 报 则 被 放置 在 以 太 网 帧 中 (6.4.2 节 )。 该 以 太 网 
帧 具有 目的 MAC 地 址 FF: FF: FF: FF: FF: FF， 使 该 帧 将 广播 到 与 交换 机 连接 的 所 有 设备 
(如 果 顺 利 的 话 也 包括 DHCP 服务 器 ); AWAY UR MAC 地 址 是 Bob 便携 机 的 MAC 地 址 
00: 16: D3:23:68:8A。 

3) 包含 DHCP 请 求 的 广播 以 太 网 帧 是 第 一 个 由 Bob 便携 机 发 送 到 以 太 网 交换 机 的 帧 。 
该 交换 机 在 所 有 的 出 端口 广播 入 帧 ， 包 括 连接 到 路 由 器 的 端口 。 

4) 路 由 器 在 它 的 具有 MAC 地 址 00: 22: 6B: 45: 1F 的 接口 接收 到 该 广播 以 太 网 帧 ， 该 
帧 中 包含 DHCP 请 求 ， 并 且 从 该 以 太 网 帧 中 抽取 出 卫 数据 报 。 该 数据 报 的 广播 卫 目的 地 
址 指示 了 这 个 IP 数据 报应 当 由 在 该 节点 的 高 层 协议 处 理 ， 因 此 该 数据 报 的 载荷 〈 一 个 
UDP 报 文 段 ) 被 分 解 (3.2 节 ) 向 上 到 达 UDP，DHCP 请 求 报 文 从 此 UDP 报 文 段 中 抽取 
出 来 。 此 时 DHCP 服务 器 有 了 DHCP 请 求 报 文 。 

5) 我 们 假设 运行 在 路 由 器 中 的 DHCP 服务 器 能 够 以 CIDR (4.3.3 节 ) 抉 68.85. 2. 0/ 
24 分 配 IP 地 址 。 所 以 本 例 中 ， 在 学 校内 使 用 的 所 有 IP 地 址 都 在 Comcast 的 地 址 块 中 。 我 
们 假设 DHCP 服务 器 分 配 地 址 68. 85. 2. 101 给 Bob 的 便携 机 。DHCP 服务 器 生成 包含 这 个 
IP 地址 以 及 DNS 服务 器 的 IP 地址 (68.87.71.226)、 默 认 网 关 路 由 器 的 IP 地 址 
(68. 85. 2. 1) 和 子 网 块 (68. 85. 2.0/24) (等 价 为 “网 络 掩 码 ”) 的 一 个 DHCP ACK 报 文 
(4.3.3 节 )。 该 DHCP 报 文 被 放 入 一 个 UDP 报 文 段 中 ，UDP 报 文 段 被 放 人 一 个 卫 数 据 报 
中 ， 卫 数据 报 再 被 放 人 一 个 以 太 网 帧 中 。 这 个 以 太 网 帧 的 源 MAC 地 址 是 路 由 器 连 到 归属 
网 络 时 接口 的 MAC 地 址 (00:22:6B:45:1F:1B), HÉJ MAC 地址 是 Bob 便携 机 的 MAC 地 
tk (00: 16: D3:23:68:8A) 。 

6) 包含 DHCP ACK 的 以 太 网 帆 由 路 由 器 发 送 给 交换 机 。 因 为 交换 机 是 自学 习 的 
(6.4.3 节 )， 并 且 先 前 从 Bob 便携 机 收 到 (包含 DHCP 请 求 的) 以 太 网 帧 ， 所 以 该 交换 机 
知道 寻 址 到 00: 16: D3:23:68: 8A 的 帧 仅 从 通 向 Bob 便携 机 的 输出 端口 转发 。 

7) Bob 便携 机 接收 到 包含 DHCP ACK 的 以 太 网 帆 ， 从 该 以 太 网 帧 中 抽取 IP 数据 报 ， 
从 也 数据 报 中 抽取 UDP HRE, MA UDP 报 文 段 抽 取 DHCP ACK 报 文 。Bob 的 DHCP 客户 
则 记录 下 它 的 他 地址 和 它 的 DNS 服务 器 的 卫 地 址 。 它 还 在 其 IP 转发 表 中 安装 默认 网 关 
的 地 址 (4. 1 节 ) Bob 便携 机 将 向 该 默认 网 关 发 送 目的 地 址 为 其 子 网 68. 85. 2.0/24 以 外 
的 所 有 数据 报 。 此 时 ，Bob 便携 机 已 经 初始 化 好 它 的 网 络 组 件 ， 并 准备 开始 处 理 Web 网 页 
获取 s-( 注意 到 在 第 4 章 给 出 的 四 个 步骤 中 仅 有 最 后 两 个 DHCP 步骤 是 实际 必要 的 。) 


6.7.2 仍 在 准备 : DNS 和 ARP 


当 Bob 将 www. google. com 的 URL 键入 其 Web 浏览 器 时 ， 他 开启 了 一 长 串 事件 ， 这 将 
导致 谷歌 主页 最 终 显示 在 其 Web 浏览 器 上 。Bob 的 Web 浏览 器 通过 生成 一 个 TCP ERF 
(2.7 节 ) 开始 了 该 过 程 ， 套 接 字 用 于 向 www. google. com RIF HTTP 请 求 (2.2 节 )。 为 了 
生成 该 套 接 字 ，Bob 便携 机 将 需要 知道 www. google. com 的 IP 地址。 我 们 在 2.4 节 中 学 过 ， 
使 用 DNS 协议 提供 这 种 名 字 到 IP 地 址 的 转换 服务 。 

8) Bob 便携 机 上 的 操作 系统 因此 生成 一 个 DNS 查询 报 文 (2.4.3 节 )， 将 字符 串 
www. google. com 放 和 人 DNS 报 文 的 问题 段 中 。 该 DNS 报 文 则 放置 在 一 个 具有 53 号 (DNS 服务 
az) 目的 端口 的 UDP 报 文 段 中 。 该 UDP 报 文 段 则 被 放 六 具有 IP 目的 地 址 68. 87.71. 226 (在 
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38 5 46+ DHCP ACK 返回 的 DNS 服务 器 地 址 ) 和 源 IP 地 址 68. 85.2. 101 的 IP 数据 报 中 。 

9) Bob 便携 机 则 将 包含 DNS 请 求 报 文 的 数据 报 放 入 一 个 以 太 网 帧 中 。 该 帧 将 发 送 
(在 链 路 层 寻 址 ) 到 Bob 学 校 网 络 中 的 网 关 路 由 器 。 然 而 ， 即 使 Bob 便携 机 经 过 上 述 第 5 
步 中 的 DHCP ACK 报 文 知道 了 学 校 网 关 路 由 器 的 IP 地 址 (68. 85.2. 1) ， 但 仍 不 知道 该 网 
关 路 由 器 的 MAC 地 址 。 为 了 获得 该 网 关 路 由 器 的 MAC 地 址 ，Bob 便携 机 将 需要 使 用 ARP 
协议 (6.4.1 47). 

10) Bob 便携 机 生成 一 个 具有 目的 IP Heh 68. 85.2.1 (默认 网 关 ) 的 ARP 查询 报 文 ， 
将 该 ARP 报 文 放 置 在 一 个 具有 广播 目的 地 址 (FF: FF: FF: FF: FF: FF) 的 以 太 网 帧 中 ， 并 
向 交换 机 发 送 该 以 太 网 帧 ， 交 换 机 将 该 帆 交 付 给 所 有 连接 的 设备 ， 包 括 网 关 路 由 器 。 

11) 网 关 路 由 器 在 通 往 学 校 网 络 的 接口 上 接收 到 包含 该 ARP 查询 报 文 的 帧 ， 发 现在 
ARP 报 文中 目标 IP 地 址 68. 85. 2. 1 匹配 其 接口 的 IP 地 址 。 网 关 路 由 器 因此 准备 一 个 ARP 
回答 ， 指 示 它 的 MAC 地址 00: 22: 6B: 45: 1F: 1B 对 应 IP 地 址 68. 85. 2. 1。 它 将 ARP 回答 放 
在 一 个 以 太 网 帧 中 ， 其 目的 地 址 为 00: 16: D3: 23: 68: 8A (Bob 便携 机 )， 并 向 交换 机 发 送 
该 帧 ， 再 由 交换 机 将 帧 交付 给 Bob 便携 机 。 

12) Bob 便携 机 接收 包含 ARP 回答 报 文 的 帧 ， 并 从 ARP 回答 报 文 中 抽取 网 关 路 由 器 
的 MAC 地 址 (00:22: 6B: 45: 1F: 1B)。 

13) Bob 便携 机 现在 (FRA!) 能 够 使 包含 DNS 查询 的 以 太 网 帧 寻 址 到 网 关 路 由 器 的 
MAC 地 址 。 注 意 到 在 该 帧 中 的 IP 数据 报 具 有 IP 目的 地 址 68. 87.71. 226 (DNS 服务 器 ) ， 
而 该 帧 具有 目的 地 址 00: 22: 6B: 45: 1F: 1B (网 关 路 由 器 ) Bob 便携 机 向 交换 机 发 送 该 帧 ， 
交换 机 将 该 帧 交付 给 网 关 路 由 器 。 


6.7.3 仍 在 准备 : 域内 路 由 选择 到 DNS 服务 器 


14) 网 关 路 由 器 接收 该 帧 并 抽取 包含 DNS 查询 的 IP 数据 报 。 路 由 器 查找 该 数据 报 的 
目的 地 址 (68. 87. 71. 226) ， 并 根据 其 转发 表决 定 该 数据 报应 当 发 送 到 图 6-32 的 Comcast 
网 络 中 最 左边 的 路 由 器 。IP 数据 报 放置 在 链 路 层 帧 中 ， 该 链 路 适合 将 学 校 路 由 器 连接 到 最 
左边 Comcast 路 由 器 ， 并 且 该 帧 经 这 条 链 路 发 送 。 

15) 在 Comcast 网 络 中 最 左边 的 路 由 器 接收 到 该 帧 ， 抽 取 IP 数据 报 ， 检 查 该 数据 报 的 
目的 地 址 (68. 87. 71.226) ， 并 根据 其 转发 表 确定 出 接 日 ， 经 过 该 接口 朝 着 DNS 服务 器 转 
发 数据 报 ， 而 转发 表 已 根据 Comcast 的 域内 协议 (如 RIP, OSPF at IS-IS, 5.3 47) 以 及 因 
特 网 的 域 间 协 议 BGP (5.4 节 ) 所 填写 。 

16) 最 终 包 含 DNS 查询 的 IP 数据 报到 达 了 DNS 服务 器 。DNS 服务 器 抽取 出 DNS 查 
询 报 文 ， 在 它 的 DNS 数据 库 中 查找 名 字 www. google. com (2.4 节 )， 找 到 包含 对 应 
www. google. com 的 IP 地 址 (64.233. 169. 105) 的 DNS 源 记 录 。 (假设 它 当 前 缓存 在 DNS 
服务 器 中 。) 前 面 讲 过 这 种 缓存 数据 源 于 google. com 的 权威 DNS 服务 器 (2.4.2 节 )。 该 
DNS 服务 器 形成 了 一 个 包含 这 种 主机 名 到 IP 地 址 映射 的 DNS 回答 报 文 ， 将 该 DNS 回答 报 
文 放 和 人 UDP 报 文 段 中 ,该 报 文 段 放 入 寻 址 到 Bob 便携 机 (68. 85.2. 101) 的 全 数据 报 中 。 
该 数据 报 将 通过 Comcast 网 络 反 向 转发 到 学 校 的 路 由 器 ， 并 从 这 里 经 过 以 太 网 交换 机 到 
Bob 便携 机 。 

17) Bob 便携 机 从 DNS 报 文 抽取 出 服务 器 www. google. com 的 IP 地 址 。 最 终 ， 在 大 量 
工作 后 ，Bob 便携 机 此 时 准备 接触 www. google. com 服务 器 ! 
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6.7.4 Web $A -服务 器 交互 : TCP 和 HTTP 


18) 既然 Bob 便携 机 有 了 www. google. com 的 IP 地 址 ， 它 能 够 生成 TCP 套 接 字 (2.7 
节 ) ， 该 套 接 字 将 用 于 向 www. google. com 发 送 HTTP GET 报 文 (2.2.3 节 )。 当 Bob 生成 
TCP 套 接 字 时 ， 在 Bob 便携 机 中 的 TCP 必须 首先 与 www. google. com 中 的 TCP 执行 三 次 握手 
(3.5.6 节 ) 。Bob 便携 机 因此 首先 生成 一 个 具有 目的 端口 80 (针对 HTTP 的 ) 的 TCP SYN 
报 文 段 ， 将 该 TCP 报 文 段 放置 在 具有 目的 IP 地 址 64. 233. 169. 105 (www. google. com) fy IP 
数据 报 中 ， 将 该 数据 报 放置 在 MAC 地 址 为 00: 22: 6B: 45: 1F: 1B (网 关 路 由 器 ) 的 帧 中 ， 
并 向 交换 机 发 送 该 帧 。 

19) EFRA, Comcast 网 络 和 谷歌 网 络 中 的 路 由 器 朝 着 www. google. com 转发 包含 
TCP SYN 的 数据 报 ， 使 用 每 台 路 由 器 中 的 转发 表 ， 如 前 面 步骤 14 ~ 16 那样 。 前 面 讲 过 支 
配 分 组 经 Comcast 和 谷歌 网 络 之 间 域 间 链 路 转发 的 路 由 器 转发 表 项 ， 是 由 BGP 协议 决定 
的 (第 5 章 )。 

20) 最 终 ， 包 含 TCP SYN 的 数据 报到 达 www. googole. com。 从 数据 报 抽 取出 TCP SYN 
报 文 并 分 解 到 与 端口 80 相 联 系 的 欢迎 套 接 字 。 对 于 谷歌 HTTP 服务 器 和 Bob 便携 机 之 间 
的 TCP 连接 生成 一 个 连接 套 接 字 (2.7 节 )。 产 生 一 个 TCP SYNACK (3.5.6 节 ) 报 文 段 ， 
将 其 放 入 向 Bob 便携 机 寻 址 的 一 个 数据 报 中 ， 最 后 放 入 链 路 层 帧 中 , 该 链 路 适合 将 
www. google. com 连接 到 其 第 一 跳 路 由 器 。 

21) 包含 TCP SYNACK 报 文 段 的 数据 报 通 过 谷歌 、Comcast 和 学 校 网 络 ， 最 终 到 达 
Bob 便携 机 的 以 太 网 卡 。 数 据 报 在 操作 系统 中 分 解 到 步骤 18 生成 的 TCP ERF, MTH 
入 连接 状态 。 

22) 借助 于 Bob 便携 机 上 的 套 接 字 ,现在 (终于 !) 准备 向 www. google. com 发 送 字 节 
T, Bob 的 浏览 器 生成 包含 要 获取 的 URL 的 HTTP GET 报 文 (2.2.3 节 )。HTTP GET 报 文 
则 写 和 人 套 接 字 ， 其 中 GET 报 文成 为 一 个 TCP 报 文 段 的 载荷 。 该 TCP 报 文 段 放 置 进 一 个 数 
据 报 中 ， 并 交付 到 www. google. com， 如 前 面 步骤 18 ~20 所 述 。 

23) 在 www. google. com 的 HTTP 服务 器 从 TCP 套 接 字 读 取 HTTP GET 报 文 ， 生 成 一 
A~ HTTP 响应 报 文 (2. 2 节 ) ， 将 请 求 的 Web 页 内 容 放 和 人 HTTP 响应 体 中 ， 并 将 报 文 发 送 
进 TCP 套 接 字 中 。 

24) 包含 HTTP 回答 报 文 的 数据 报 通过 谷歌 、Comcast 和 学 校 网 络 转发 ， 到 达 Bob 便 
携 机 。Bob 的 Web 浏览 器 程序 从 套 接 字 读 取 HTTP 响应 ， 从 HTTP 响应 体 中 抽取 Web 网 页 
的 html, FRA (AF!) 显示 了 Web 网 页 。 

上 面 的 场景 已 经 涉及 许多 网 络 基础 ! 如 果 你 已 经 理解 上 面 例 子 中 的 大 多 数 或 全 
部 ， 则 你 也 已 经 涵盖 了 许多 基础 知识 ， 因 为 前 面 已 经 学 过 1. 1 节 ， 其 中 我 们 谈 道 “本 
书 的 大 部 分 内 容 与 计算 机 网 络 协议 有 关 ”， 并 且 你 也 许 想 知道 一 个 协议 实际 是 什么 样 
F! 上 述 例子 看 起 来 是 尽 可 能 详尽 ， 我 们 已 经 忽略 了 一 些 可 能 的 附加 协议 〈 例 如 ， 运 
行 在 学 校 网 关 路 由 器 中 的 NAT， 到 学 校 网 络 的 无 线 接 人 ， 接 和 学校 网 络 或 对 报 文 段 或 
数据 报 加 密 的 安全 协议 ， 网 络 管理 协议 ) ， 以 及 人 们 将 会 在 公共 因特网 中 遇 到 的 一 些 
考虑 (Web 缓存 ，DNS 等 级 体系 ) 。 我 们 将 在 本 书 的 第 二 部 分 涉及 一 些 这 类 主题 和 更 
多 内 容 。 

最 后 ， 我 们 注意 到 上 述 例子 是 一 个 综合 、 完 整 的 例子 ， 还 观察 了 本 书 第 一 部 分 所 学 习 
过 的 许多 协议 的 十 分 “具体 的 细节 ”。 该 例子 更 多 地 关注 “怎样 做 ”而 不 是 “为 什么 做 ”。 
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对 于 想 开 阔 视 野 的 读者 来 说 ， 有 关 网 络 协议 设计 更 为 深思 熟 虑 的 一 般 观点 可 参见 [Clark 
1988; RFC 5218], 


6.8 小 结 


在 这 一 章 中 ,我 们 学 习 了 链 路 层 ， 包 括 它 的 服务 、 支 撑 它 操作 的 原则 和 许多 重要 的 特 
定 协议 ,它们 使 用 这 些 原则 实现 了 链 路 层 服务 。 

我 们 看 到 链 路 层 的 基本 服务 是 将 网 络 层 的 数据 报 从 一 个 节点 主机、 交换机、 路 由 
器 ，WiFi RAR) 移动 到 一 个 相 邻 的 节点 。 我 们 看 到 ， 在 通过 链 路 向 相 邻 节点 传输 之 前 ， 
所 有 链 路 层 协 议 都 是 通过 将 网 络 层 数 据 报 封装 在 链 路 层 帧 中 来 操作 的 。 然 而 ， 除 了 这 个 共 
同 的 成 帧 功能 之 外 ， 我 们 知道 了 不 同 的 链 路 层 协议 提供 截然 不 同 的 链 路 接 人 、 交 付 和 传输 
服务 。 造 成 这 些 差 异 的 部 分 原因 是 链 路 层 协议 必须 工作 在 很 多 种 链 路 类 型 上 。 一 个 简单 的 
点 对 点 链 路 具有 单个 发 送 方 和 接收 方 ， 并 通过 单一 “线路 ”通信 。 一 个 多 路 访问 链 路 在 许 
多 发 送 方 和 接收 方 之 间 共 享 ; 因此 ， 对 多 路 访问 信道 的 链 路 层 协议 有 一 个 协调 链 路 接 人 的 
协议 〈 它 的 多 路 访问 协议 ) 。 在 MPLS 的 情况 下 ， 连 接 两 个 相 邻 节点 〈 例 如 , fe IP EME 

两 台 相 邻 的 了 P 路 由 器 ， 它 们 是 到 某 个 目的 地 的 下 一 跳 PP 路 由 器 ) 的 “ 链 路 ”， 其 本 身 
可 能 实际 上 就 是 一 个 网 络 。 从 某 种 意义 来 说 ， 将 一 个 网 络 视 为 一 条 “ 链 路 ”的 想法 没有 什 
么 可 奇怪 的 。 例 如 ， 连 接 家 庭 调制 解 调 器 /计算 机 到 远 端 调制 解 调 器 /路 由 器 的 一 条 电话 链 
路 ， 实 际 上 是 一 条 穿 过 精密 而 复杂 的 电话 网 络 的 路 径 。 

在 链 路 层 通信 所 依据 的 原理 中 ， 我 们 研究 了 差错 检测 和 纠正 技术 、 多 路 访问 协议 、 
链 路 层 寻 址 、 虚 拟 化 (VLAN) 以 及 扩展 的 交换 局 域 网 和 数据 中 心 网 络 的 构造 方法 。 今 
天 对 链 路 层 的 许多 关注 在 于 这 些 交换 网 络 。 在 差错 检测 /纠正 场景 中 ， 为 了 对 帧 通过 链 
路 传输 时 可 能 发 生 的 比特 翻转 进行 检测 并 在 某 些 情况 下 进行 纠正 ， 我 们 研究 了 在 帧 的 首 
部 增加 附加 比特 的 方法 。 我 们 讨论 了 简单 的 奇偶 校 验 和 检验 和 方案 ， 以 及 更 健壮 的 循环 
宛 余 检测 。 然 后 我 们 转向 多 路 访问 协议 主题 。 我 们 确定 和 学 习 了 协调 访问 广播 信道 的 3 
大 类 方法 : 信道 划分 方法 (TDM, FDM) 、 随 机 接 人 方法 (ALOHA 协议 和 CSMA 协议 ) 
和 轮流 方法 〈 轮 询 和 令 牌 传递 ) 。 我 们 学 习 了 电缆 接 人 网 ， 发 现 它 使 用 了 多 种 这 些 多 路 
访问 方法 。 我 们 看 到 让 多 个 节点 共享 单个 广播 信道 的 结果 ， 是 需要 在 链 路 层 提供 节点 地 
址 。 我 们 知道 物理 地 址 和 网 络 层 地 址 是 非常 不 同 的， 而 且 在 因特网 场景 中 ， 一 个 专门 的 
协议 《ARP， 即 地 址 解析 协议 ) 用 于 在 这 两 种 寻 址 形式 之 间 进 行 转换 ， 并 且 详 细 学 习 了 
极为 成 功 的 以 太 网 协议 。 然 后 我 们 研究 了 共享 一 个 广播 信道 的 节点 是 怎样 形成 一 个 局 域 
网 的 ， 以 及 多 个 局 域 网 怎样 能 够 互联 形成 一 个 更 大 的 局 域 网 ， 即 互联 这 些 本 地 节点 完全 
不 需要 网 络 层 路 由 选择 的 干预 。 我 们 也 知道 了 多 个 虚拟 局 域 网 是 怎样 能 够 产生 一 个 单一 
的 物理 局 域 网 体系 结构 的 。 

通过 关注 当 MPLS 网 络 互联 了 P 路 由 器 时 是 如 何 提供 链 路 层 服务 的 和 展望 今天 用 于 大 型 
数据 中 心 的 网 络 设计 ， 我们 结束 了 链 路 层 的 学 习 。 通 过 识别 在 获取 一 个 简单 的 Web 网 页 
时 所 需要 的 许多 协议 , 我们 完成 了 本 章 (和 前 5 章 )。 在 学 习 了 链 路 层 后 ， 我 们 沿 协议 栈 
向 下 的 旅程 现在 结束 了 ! 当然 ， 物 理 层 位 于 数据 链 路 层 之 下 ， 但 是 物理 层 的 细节 也 许 最 好 
留 给 另外 一 门 课程 (例如 ， 在 通信 理论 而 不 是 计算 机 网 络 课程 中 ) 去 学 习 。 然 而 我 们 在 本 
章 和 第 1 章 (在 1.2 节 中 讨论 了 物理 媒体 ) 中 已 经 接触 了 物理 层 的 几 个 方面 。 当 我 们 在 下 
一 章 中 学 习 无 线 链 路 特性 时 ， 将 再 次 考虑 物理 层 。 
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尽管 我 们 沿 协议 栈 向 下 的 旅程 已 结束 ， 但 我 们 计算 机 网 络 的 学 习 仍 然 没 有 结束 。 在 后 
面 的 3 章 中 我 们 将 讨论 无 线 网 络 、 网 络 安全 和 多 媒体 网 络 。 这 3 个 主题 不 便 放 进 任何 一 层 
中 ; 实际 上 每 个 主题 跨越 了 多 个 层次 。 因 此 理解 这 些 主题 (在 某 些 网 络 教材 中 被 列 为 高 级 
主题 ) 需要 对 协议 栈 所 有 层次 都 有 坚实 的 基础 ， 我 们 对 链 路 层 的 学 习 已 经 完成 了 这 样 的 
基础 ! 


课 后 习题 和 问题 

Be 

Asa 

6.1-6.2 4% 

RI. 考虑 在 6. 1. 1 节 中 的 运输 类 比 。 如 果 一 个 乘客 类 比 为 一 个 数据 报 ， 什 么 类 比 于 链 路 层 帧 ? 

R2. 如 果 在 因特网 中 的 所 有 链 路 都 提供 可 靠 的 交付 服务 ，TCP 可 靠 传 输 服 务 将 是 多 余 的 吗 ? 为 什么 ? 

R3. 链 路 层 协议 能 够 向 网 络 层 提供 哪些 可 能 的 服务 ?在 这 些 链 路 层 服务 中 ， 哪 些 在 IP 中 有 对 应 的 服务 ? 
哪些 在 TCP 中 有 对 应 的 服务 ? 

6.3 节 

R4. 假设 两 个 节点 同时 经 一 个 速率 为 RR 的 广播 信道 开始 传输 一 个 长 度 为 上 的 分 组 。 用 do 表示 这 两 个 节 
点 之 间 的 传播 时 延 。 如 果 do < LAR ,会 出 现 碰撞 吗 ? 为 什么 ? 

RS. 在 6.3 节 中 ,我 们 列 出 了 广播 信道 的 4 种 希望 的 特性 。 这 些 特 性 中 的 哪些 是 时 隙 ALOHA 所 具有 的 ? 
令 牌 传递 具有 这 些 特性 中 的 哪些 ? 

R6. 在 CSMA/CD 中 ,在 第 5 次 碰撞 后 ， 节 点 选择 上 =4 的 概率 有 多 大 ? 结果 K=4 在 10Mbps 以 太 网 上 对 
应 于 多 少 秒 的 时 延 ? 

R7. 使 用 人 类 在 鸡尾酒 会 交互 的 类 比 来 描述 轮 询 和 令 牌 传递 协议 。 

R8. 如 果 局 域 网 有 很 大 的 周 长 时 ， 为 什么 令 牌 环 协议 将 是 低 效 的 ? 

6.4% 

R9. MAC 地 址 空间 有 多 大 ? IPv4 的 地 址 空间 呢 ? IP vO 的 地 址 空间 呢 ? 

R10. 假设 节点 A、B 和 C (通过 它们 的 适配器 ) 都 连接 到 同一 个 广播 局 域 网 上 。 如 果 A 向 B 发 送 数 千 个 
IP 数据 报 ， 每 个 封装 帧 都 有 BAY MAC 地 址 ，C 的 适配器 会 处 理 这 些 帧 吗 ? 如 果 会 ,C 的 适配器 将 
会 把 这 些 帧 中 的 IP 数据 报 传递 给 C 的 网 络 层 吗 ? 如 果 A 用 MAC 广播 地 址 来 发 送 这 些 帧 ， 你 的 回答 
将 有 怎样 的 变化 呢 ? 

R11. ARP 查询 为 什么 要 在 广播 帧 中 发 送 呢 ? ARP 响应 为 什么 要 在 一 个 具有 特定 目的 MAC 地 址 的 帧 中 发 
送 呢 ? 

R12. 对 于 图 6-19 中 的 网 络 ， 路 由 器 有 两 个 ARP 模块 ， 每 个 都 有 自己 的 ARP 表 。 同 样 的 MAC 地 址 可 能 
在 两 张 表 中 都 出 现 吗 ? 

R13. 比较 10BASE-T、100BASE-T 和 吉 比 特 以 太 网 的 帧 结构 。 它 们 有 什么 不 同 吗 ? 

R14. 考虑 图 6-15。 在 4.3 节 的 寻 址 意义 下 ， 有 多 少 个 子 网 呢 ? 

R15. 在 一 个 支持 802. 1Q 协议 交换 机 上 能 够 配置 的 VLAN 的 最 大 数量 是 多 少 ? 为 什么 ? 

R16. 假设 支持 KK 个 VLAN 组 的 N 台 交 换 机 经 过 一 个 干线 协议 连接 起 来 。 连 接 这 些 交 换 机 需要 多 少 端口 ? 
评价 你 的 答案 。 


习题 


Pl. 假设 某 分 组 的 信息 内 容 是 比特 模式 1110 0110 1001 1101， 并 且 使 用 了 偶 校 验方 案 。 在 采用 二 维 奇 
偶 校 验方 案 的 情况 下 ， 包 含 该 检验 比特 的 字段 的 值 是 什么 ? 你 的 回答 应 该 使 用 最 小 长 度 检验 和 
字段 。 


P4. 
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. 说 明 〈 举 一 个 不 同 于 图 6-5 的 例子 ) 二 维 奇偶 校 验 能 够 纠正 和 检测 单 比特 差错 。 说 明 〈 举 一个 例子 ) 


某 些 双 比特 差错 能 够 被 检测 但 不 能 纠正 。 


. 假设 某 分 组 的 信息 部 分 (图 6-3 中 的 D) 包含 10 字 节 ， 它 由 字符 串 “Networking” 的 8 比特 无 符号 二 


进 制 ASCI 表示 组 成 。 对 该 数据 计算 因特网 检验 和 。 
考虑 前 一 个 习题 ,但 此 时 假设 这 10 字 节 包含 : 
a. 数字 1 到 10 的 二 进 制 表示 。 
b. FE BFK (大 写 ) 的 ASCH 表示 。 
c. 字母 b 到 k (小 写 ) 的 ASCH 表示 。 
计算 这 些 数据 的 因特网 检验 和 。 


. 考虑 5 比特 生成 多 项 式 ,，G =10011, 并 且 假 设 D 的 值 为 1010101010。R 的 值 是 什么 ? 
. 考虑 上 一 个 习题 ， 这 时 假设 D 具 有 值 : 

a. 1001010101, 

b. 0101101010。 

c. 1010100000。 


. 在 这 道 习 题 中 ， 我们 探讨 CRC 的 某 些 性 质 。 对 于 在 6.2.3 节 中 给 出 的 生成 多 项 式 G =1001)， 回 答 


下 列 问题 : 
a. 为 什么 它 能 够 检测 数据 D 中 的 任何 单 比特 差错 ? 
b. EX G 能 够 检测 任何 奇数 比特 差错 吗 ? 为 什么 ? 


. 在 6.3 节 中 , 我 们 提供 了 时 隙 ALOHA 效率 推导 的 概要 。 在 本 习题 中 ， 我 们 将 完成 这 个 推导 。 


a 前 面 讲 过 ， 当 及 个 活跃 节点 时 ， 时 隙 ALOHA 的 效率 是 Np(1 =p) 。 求 出 使 这 个 表达 式 最 大 
化 的 p 值 。 

b. 使 用 在 (a) 中 求 出 的 p 值 , 令 入 接近 于 无 穷 , 求 出 时 隙 ALOHA 的 效率 。( 提示 : YN 接近 于 无 
穷 时 ， (1 -1/N)" 接近 于 1/e) 

说 明 纯 ALOHA 的 最 大 效率 是 1/(2e) 。 注 意 : 如 果 你 完成 了 上 面 的 习题 ， 本 习题 就 很 简单 了 。 


P10. 考虑 两 个 节点 A 和 B， 它 们 都 使 用 时 隙 ALOHA 协议 来 竞争 一 个 信道 。 假 定 节点 A 比 节 点 B 有 更 多 


Pil. 


P12. 
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的 数据 要 传输 ， 并 且 节 点 A 的 重 传 概率 pa 比 节 点 B 的 重 传 概率 ps BK. 

a 给 出 节点 A 的 平均 吞吐 量 的 公式 。 具 有 这 两 个 节点 的 协议 的 总 体 效 率 是 多 少 ? 

b. 如 果 p=2ps， 节 点 A 的 平均 吞吐 量 比 节点 B 的 要 大 两 倍 吗 ? 为 什么 ?如 果 不 是 ， 你 能 够 选择 什 
ARERI pa 和 ps 使 得 其 成 立 ? 

c. 一 般 而 言 ， 假 设 有 NN 个 节点 ， 其 中 的 节点 A 具有 重 传 概率 2p 并 且 所 有 其 他 节点 具有 重 传 概率 po 
给 出 表达 式 来 计算 节点 A 和 其 他 任何 节点 的 平均 吞吐 量 。 

假定 4 个 活跃 节点 A、B、C 和 D 都 使 用 时 隙 ALOHA 来 竞争 访问 某 信道 。 假 设 每 个 节点 有 无 限 个 分 

组 要 发 送 。 每 个 节点 在 每 个 时 隙 中 以 概率 p 尝试 传输 。 第 一 个 时 际 编号 为 时 隙 1， 第 二 个 时 隙 编号 

为 时 隙 2， 等 等 。 

a 节点 A 在 时 隙 5 中 首先 成 功 的 概率 是 多 少 ? 

b. 某 个 节点 (A, B, CRD) 在 时 隙 4 中 成 功 的 概率 是 多 少 ? 

c 在 时 隙 3 中 出 现 首 个 成 功 的 概率 是 多 少 ? 

d 这 个 4 节点 系统 的 效率 是 多 少 ? 

对 NN 的 下 列 值 ， 画 出 以 p 为 函数 的 时 辽 ALOHA 和 纯 ALOHA 的 效率 。 

a. M=15, 

b. N=25, 

G N=355 

考虑 具有 W 个 节点 和 传输 速率 为 bps 的 一 个 广播 信道 。 假 设 该 广播 信道 使 用 轮 询 进行 多 路 访问 

(有 一 个 附加 的 轮 询 节点 ) 。 假设 从 某 节点 完成 传输 到 后 续 节 点 允许 传输 之 间 的 时 间 量 ( 即 轮 询 时 

XE) 是 di 。 假 设 在 一 个 轮 询 周期 中 ， 一 个 给 定 的 节点 允许 至 多 传输 Q 比特 。 该 广播 信道 的 最 大 吞 
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吐 量 是 多 少 ? 

如 图 6-33 所 示 ， 考 虑 通过 两 台 路 由 器 互联 的 3 个 局 域 网 。 

a. 对 所 有 的 接口 分 配 IP 地 址 。 对 子 网 1 使 用 形式 为 192. 168. 1. xxx 的 地 址 ， 对 子 网 2 使 用 形式 为 
192. 168. 2. xxx 的 地 址 ， 对 子 网 3 使 用 形式 为 192. 168. 3. xxx 的 地 址 。 

b. 为 所 有 的 适配器 分 配 MAC 地 址 。 

c. 考虑 从 主机 下 向 主机 B 发 送 一 个 全数 据 报 。 假 设 所 有 的 ARP 表 都 是 最 新 的 。 就 像 在 6.4. 1 节 中 
对 单 路 由 器 例子 所 做 的 那样 ， 列 举 出 所 有 步骤 。 

d 重复 (e) ， 现 在 假设 在 发 送 主机 中 的 ARP 表 为 空 〈 并 且 其 他 表 都 是 最 新 的 ) 。 

考虑 图 6-33。 现 在 我 们 用 一 台 交 换 机 代替 子 Cc 

网 1 和 子 网 2 之 间 的 路 由 器 ， 并 且 将 子 网 2 m 

和 子 网 3 之 间 的 路 由 器 标记 为 Rl。 

a 考虑 从 主机 了 向 主机 了 发 送 一 个 IP 数据 
报 。 主 机 将 请 求 路 由 器 RI 帮助 转发 该 
数据 报 吗 ?为 什么 ? eas IP 数据 报 的 以 
太 网 帧 中 ， 源 和 目的 IP 和 MAC 地 址 分 别 
是 什么 ? 

b. 假定 希望 向 B 发 送 一 个 下 数据 报 ， 假 设 
E 的 ARP 缓存 中 不 包含 B 的 MAC thk, E 
将 执行 ARP 查询 来 发 现 B 的 MAC 地 址 吗 ? 
为 什么 ? 在 交付 给 路 由 器 RI 的 以 太 网 帧 
(包含 发 向 B 的 数据 报 ) P, 源 和 目的 
IP 和 MAC 地 址 分 别 是 什么 ? 图 6-33 由 路 由 器 互联 的 3 个 子 网 

c. 假定 主机 A 希望 向 主机 B 发 送 一 个 卫 数 据 报 ，A 的 ARP 缓存 不 包含 B 的 MAC 地 址 ，B 的 ARP 
缓存 也 不 包含 A 的 MAC 地 址 。 进 一 步 假 定 交 换 机 SI 的 转发 表 仅 包 含 主机 B 和 路 由 器 R 的 表 
项 。 因 此 ，A 将 广播 一 个 ARP 请 求 报 文 。 一 旦 交换 机 S1 收 到 ARP 请 求 报 文 将 执行 什么 动作 ? 路 
由 器 RI 也 会 收 到 这 个 ARP 请 求 报 文 吗 ? 如 果 收 到 的 话 ，Rl 将 向 子 网 3 转发 该 报 文 吗 ? 一 旦 主 
机 B 收 到 这 个 ARP 请 求 报 文 ， 它 将 向 主机 A 回 发 一 个 ARP 响应 报 文 。 但 是 它 将 发 送 一 个 ARP 查 
询 报 文 来 请 求 A 的 MAC 地 址 吗 ? 为 什么 ? 一 旦 交换 机 S1 收 到 来 自主 机 B 的 一 个 ARP 响应 报 文 ， 
它 将 做 什么 ? 

考虑 前 面 的 习题 ， 但 是 现在 假设 用 一 台 交 换 机 代替 子 网 2 和 子 网 3 之 间 的 路 由 器 ， 在 这 种 新 的 场景 

中 回答 前 面 习题 中 的 问题 (a) ~ (e)a 

前 面 讲 过 ， 使 用 CSMA/CD 协议 ,适配器 在 碰撞 之 后 等 待 K* 512 比特 时 间 ， 其 中 是 随机 选取 的 。 

对 于 天 =100， 对 于 一 个 10Mbps 的 广播 信道 ， 适 配器 返回 到 第 二 步 要 等 多 长 时 间 ? 对 于 100Mbps 的 

广播 信道 来 说 呢 ? 

假设 节点 A 和 节点 B 在 同一 个 10Mbps 广播 信道 上 ， 这 两 个 节点 的 传播 时 延 为 325 比特 时 间 。 假 设 

对 这 个 广播 信道 使 用 CSMA/CD 和 以 太 网 分 组 。 假 设 节点 A 开始 传输 一 帧 ， 并 且 在 它 传输 结束 之 前 

节点 B 开始 传输 一 帧 。 在 A 检测 到 B 已 经 传输 之 前 ，A 能 完成 传输 吗 ? 为 什么 ? 如 果 回 答 是 可 以 ， 

则 A 错误 地 认为 它 的 帧 已 成 功 传输 而 无 碰撞 。 提 示 : 假设 在 !=0 比特 时 刻 ，A 开始 传输 一 帧 。 在 最 

坏 的 情况 下 ，A 传输 一 个 512 +64 比特 时 间 的 最 小 长 度 的 帧 。 因 此 A 将 在 +=512 +64 比特 时 刻 完成 

帧 的 传输 。 如 果 B 的 信号 在 比特 时 间 上 = 512 +64 比特 之 前 到 达 A， 则 答案 是 否定 的 。 在 最 坏 的 情况 

下 ，B 的 信号 什么 时 候 到 达 A? 

假设 节点 A 和 节点 B 在 相同 的 10Mbps 广播 信道 上 ， 并 且 这 两 个 节点 的 传播 时 延 为 245 比特 时 间 。 

假设 A 和 B 同时 发 送 以 太 网 帧 ， 帧 发 生 了 碰撞 ， 然 后 A 和 B 在 CSMA/CD 算法 中 选择 不 同 的 K 值 。 

假设 没有 其 他 节点 处 于 活跃 状态 ,来自 A 和 B 的 重 传 会 碰撞 吗 ? 为 此 ， 完 成 下 面 的 例子 就 足以 说 明 

问题 了 。 假 设 A 和 B 在 :=0 比特 时 间 开 始 传输 。 它 们 在 1=245 比特 时 间 都 检测 到 了 碰撞 。 假 设 
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K, =0, Ks = 1 。B 会 将 它 的 重 传 调整 到 什么 时 间 ? A 在 什么 时 间 开 始 发 送 ? (注意 : 这 些 节点 在 返 
回 第 2 步 之 后 ， 必 须 等 待 一 个 空闲 信道 ， 参 见 协议 。) A 的 信号 在 什么 时 间 到 达 B 呢 ?”B 在 它 预定 
的 时 刻 抑 制 传输 吗 ? 

在 这 个 习题 中 ， 你 将 对 一 个 类 似 于 CSMA/CD 的 多 路 访问 协议 的 效率 进行 推导 。 在 这 个 协议 中 ， 时 

间 分 为 时 辽 ， 并 且 所 有 适配器 都 与 时 隙 同步 。 然 而 ， 和 时 辽 ALOHA 不 同 的 是 , 一 个 时 际 的 长 度 

(以 秒 计 ) 比 一 帧 的 时 间 ( 即 传输 一 帧 的 时 间 ) 小 得 多 。 令 $ 表示 一 个 时 隙 的 长 度 。 假 设 所 有 帧 都 

有 恒定 长 度 L=kRS， 其 中 R 基 信道 的 传输 速率 ,是 一 个 大 整数 。 假 定 有 NN 个 节点 ， 每 个 节点 都 有 

无 穷 多 帧 要 发 送 。 我 们 还 假设 d,,,,，< S ， 以 便 所 有 节点 在 一 个 时 隙 时 间 结 束 之 前 能 够 检测 到 碰撞 。 

这 个 协议 描述 如 下 : 

。 对 于 某 给 定 的 时 除 ， 如 果 没 有 节点 占有 这 个 信道 ， 所 有 节点 竞争 该 信道 ; 特别 是 每 个 节点 以 概 
率 p 在 该 时 际 传输。 如 果 刚 好 有 一 个 节点 在 该 时 际 中 传输 ， 该 节点 在 后 续 的 -1 个 时 际 占有 信 
道 ， 并 传输 它 的 整个 帧 。 

。 如 果 某 节点 占用 了 信道 ， 所 有 其 他 节点 抑制 传输 ， 直 到 占有 信道 的 这 个 节点 完成 了 该 帧 的 传输 
为 止 。 一 旦 该 节点 传输 完 它 的 帧 ， 所 有 节点 竞争 该 信道 。 

注意 到 此 信道 在 两 种 状态 之 间 交 替 :“ 生 产 性 状态 ”( 它 恰 好 持续 上 个 时 阶 ) 和 “ 非 生 产 性 
状态 ”( 它 持续 随机 数 个 时 隙 )。 显 然 ， 该 信道 的 效率 是 hk/(k+x)， 其 中 x 是 连续 的 非 生产 性 时 
际 的 期 望 值 。 

a 对 于 固定 的 NN 和 pp， 确定 这 个 协议 的 效率 。 

b. 对 于 固定 的 NVN， 确 定 使 该 效率 最 大 化 的 p 值 。 

c. EHE (b) 中 求 出 的 p ( 它 是 NN 的 函数 )， 确 定 当 N 趋向 无 穷 时 的 效率 。 
d. 说 明 随 着 帧 长 度 变 大 ， 该 效率 趋 近 于 1。 

现在 考虑 习题 P14 中 的 图 6-33。 对 主机 A、 两 台 路 由 器 和 主机 下 的 各 个 接口 提供 MAC 地 址 和 下 地 

hko 假定 主机 A 向 主机 下 发送 一 个 数据 报 。 当 在 下 列 场合 传输 该 帧 时 ， 给 出 在 封装 该 中 数据 报 的 

帧 中 的 源 和 目的 MAC 地 址 : (i) 从 A 到 左边 的 路 由 器 ; (ii) 从 左边 的 路 由 器 到 右边 的 路 由 器 ; 

Cii) 从 右边 的 路 由 器 到 F。 还 要 给 出 到 达 每 个 点 时 封装 在 该 帧 中 的 IP 数据 报 中 的 源 和 目的 IP 

地 址 。 

现在 假定 在 图 6-33 最 左边 的 路 由 器 被 一 台 交 换 机 替换 。 主 机 A、B、C 和 D 和 右边 的 路 由 器 以 星 形 

方式 与 这 台 交 换 机 相连 。 当 在 下 列 场合 传输 该 帧 时 ， 给 出 在 封装 该 卫 数据 报 的 帧 中 的 源 和 目的 

MAC 地 址 : (i) 从 A 到 左边 路 由 器 ; (i) 从 左边 路 由 器 到 右边 的 路 由 器 ; (iii) 从 右边 的 路 由 器 到 

F。 还 要 给 出 到 达 每 个 点 时 封装 在 该 帧 中 的 卫 数据 报 中 源 和 目的 IP 地 址 。 

考虑 图 6-15。 假 定 所 有 链 路 都 是 100Mbps。 在 该 网 络 中 的 9 台 主 机 和 两 台 服 务 器 之 间 ， 能 够 取得 的 

最 大 总 聚合 吞吐 量 是 多 少 ? 你 能 够 假设 任何 主机 或 服务 器 能 够 向 任何 其 他 主机 或 服务 器 发 送 分 组 。 

为 什么 ? 

假定 在 图 6-15 中 的 3 台 连 接 各 系 的 交换 机 用 集线器 来 代替 。 所 有 链 路 是 100Mbps。 现 在 回答 习题 

P23 中 提出 的 问题 。 

假定 在 图 6-15 中 的 所 有 交换 机 用 集线器 来 代替 。 所 有 链 路 是 100Mbps。 现 在 回答 在 习题 P23 中 提出 

的 问题 。 

在 某 网 络 中 标识 为 A 到 下 的 6 个 节点 以 星 形 与 一 台 交 换 机 连接 ， 考 虑 在 该 网 络 环境 中 某 个 正在 

学 习 的 交换 机 的 运行 情况 。 假 定 : (i) B 向 EE 发 送 一 个 帧 ; (ii) EE 向 B 回答 一 个 帧 (二) A 

向 B 发 送 一 个 帧 ; Civ) B 向 A 回答 一 个 帧 。 该 交换 机 表 初 始 为 空 。 显 示 在 这 些 事件 的 前 后 该 

交换 机 表 的 状态 。 对 于 每 个 事件 ， 指 出 在 其 上 面 转发 传输 的 帧 的 链 路 ， 并 简要 地 评价 你 的 

答案 。 

在 这 个 习题 中 ,我 们 探讨 用 于 P 语音 应 用 的 小 分 组 。 小 分 组 长 度 的 一 个 主要 缺点 是 链 路 带宽 的 较 

大 比例 被 首部 字 节 所 消耗 。 基 于 此 ， 假 定 分 组 是 由 P 字 节 和 5 字 节 首部 组 成 。 

a 考虑 直接 发 送 一 个 数字 编码 语音 源 。 假 定 该 源 以 128kbps 的 恒定 速率 进行 编码 。 假 设 每 个 源 向 网 


P28. 
P29. 


P30. 


P31. 


P32. 


P33. 
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络 发 送 分 组 之 前 每 个 分 组 被 完全 填充 。 填 充 一 个 分 组 所 需 的 时 间 是 分 组 化 时 延 (packetization 
delay) 。 根 据 L， 确 定 分 组 化 时 延 ( 以 毫秒 计 ) 。 

b. 大 于 20 上 毫秒 的 分 组 化 时 延 会 导致 一 个 明显 的 、 令 人 不 快 的 回音 。 对 于 工 = 1500 字 节 (大致 对 
应 于 一 个 最 大 长 度 的 以 太 网 分 组 ) AL =50 字 节 (对 应 于 一 个 ATM AT), 确定 该 分 组 化 
时 延 。 

c. Xf R =622Mbps 的 链 路 速率 以 及 L=1500 FHA L=50 字 节 ,计算 单 台 交换 机 的 存储 转发 时 延 。 

d. 对 使 用 小 分 组 长 度 的 优点 进行 评述 。 

考虑 图 6-25 中 的 单个 交换 VLAN， 假 定 一 台 外 部 路 由 器 与 交换 机 端口 1 相连 。 为 EE 和 CS 的 主机 和 

路 由 器 接口 分 配 IP 地 址 。 跟 踪 从 EE 主机 向 CS 主机 传送 一 个 数据 报时 网 络 层 和 链 路 层 所 采取 的 步 

R (提示 : 重读 课文 中 对 图 6-19 的 讨论 ) 。 

考虑 显示 在 图 6-29 中 的 MPLS 网 络 ， 假 定 路 由 器 RS 和 R6 现在 是 MPLS 使 能 的 。 假 定 我 们 要 执行 流 

量 工程 ， 使 从 RO 发 往 A 的 分 组 要 经 R6-R4-R3-R1 交换 到 A, MRS 发 向 A 的 分 组 要 过 R5- R4- R2- 

RI 交换 。 给 出 RS 和 R6 中 的 MPLS 表 以 及 在 R4 中 修改 的 表 ， 使 得 这 些 成 为 可 能 。 

再 次 考虑 上 一 个 习题 中 相同 的 场景 ,但 假定 从 RO 发 往 D 的 分 组 经 R6-R4-R3 交换 ， 而 从 RS 发 往 D 

的 分 组 经 R4-R2-R1-R3 交换 。 说 明 为 使 这 些 成 为 可 能 在 所 有 路 由 器 中 的 MPLS 表 。 

在 这 个 习题 中 ， 你 将 把 已 经 学 习 过 的 因特网 协议 的 许多 东西 拼装 在 一 起 。 假 设 你 走 进 房间 ， 与 以 太 

网 连接 ， 并 下 载 一 个 Web 页 面 。 从 打开 PC 电源 到 得 到 Web 网 页 ， 发 生 的 所 有 协议 步骤 是 什么 ? 假 

设 当 你 给 PC 加 电 时 ,在 DNS 或 浏览 器 缓存 中 什么 也 没有 。( 提 示 : 步骤 包括 使 用 以 太 网 、DHCP、 

ARP, DNS, TCP 和 HTTP 协议 。) 明确 指出 在 这 些 步 又 中 你 如 何 获得 网 关 路 由 器 的 卫 和 MAC 地 址 。 

考虑 在 图 6-30 中 具有 等 级 拓扑 的 数据 中 心 网 络 。 假 设 现在 有 80 对 流 ， 在 第 1 和 第 9 机 架 之 间 有 10 

个 流 ,在 第 2 和 第 10 机 架 之 间 有 10 个 流 ， 等 等 。 进 一 步 假 设 网 络 中 的 所 有 和 链 路 是 10Gbps， 而 主机 

和 TOR 交换 机 之 间 的 链 路 是 1Gbps。 

a 每 条 流 具 有 相同 的 数据 率 ; 确定 一 条 流 的 最 大 速率 。 

b. 对 于 相同 的 流量 模式 ， 对 于 图 6-31 中 高 度 互 联 的 拓扑 ， 确 定 一 条 流 的 最 大 速率 。 

c. 现在 假设 有 类 似 的 流量 模式 ， 但 在 每 个 机 架 上 涉及 20 台 主 机 和 160 对 流 。 确 定 对 这 两 个 拓扑 的 
最 大 流速 率 。 

考虑 图 6-30 中 所 示 的 等 级 网 络 ， 并 假设 该 数据 中 心 需要 在 其 他 应 用 程序 之 间 支 持 电 子 邮 件 和 视频 分 

发 。 假 定 4 个 服务 器 机 架 预 留用 于 电子 邮件 ，4 个 服务 器 机 架 预 留用 于 视频 。 对 于 每 个 应 用 ， 所 有 

4 个 机 架 必须 位 于 某 单一 的 二 层 交 换 机 之 下 ， 因 为 二 层 到 一 层 链 路 没有 充足 的 带宽 来 支持 应 用 内 部 

的 流量 。 对 于 电子 邮件 应 用 ， 假 定 99.9% 时 间 仅 使 用 3 个 机 架 ， 并且 视 频 应 用 具有 相同 的 使 用 

模式 。 

a 电子 邮件 应 用 需要 使 用 第 4 个 机 架 的 时 间 比 例 有 多 大 ? 视频 应 用 需要 使 用 第 4 个 机 架 的 时 间 比 例 
有 多 大 ? 

b. 假设 电子 邮件 使 用 和 视频 使 用 是 独立 的 ， 这 两 个 应 用 需要 其 第 4 个 机 架 的 时 间 比 例 有 多 大 (等 价 
ih, MRA HK)? 

c 假设 对 于 一 个 应 用 服务 器 短缺 的 时 间 具 为 0.001% 或 更 少 〈 引 起 用 户 在 极 短 时 间 内 性 能 恶化 ) 。 
讨论 在 图 6-31 中 的 拓扑 能 够 怎样 使 用 ， 使 得 仅 7 个 机 架 被 共同 地 分 配给 两 个 应 用 (假设 拓扑 能 
够 支持 所 有 流量 ) 。 


‘oi Wireshark 实验 


在 与 本 教科 书 配套 的 Web 站 点 (http://www. pearsonhighered. com/cs-resources/) 上 ， 你 将 找到 一 个 


Wireshark 实验 ， 该 实验 研究 了 IEEE 802. 3 协议 的 操作 和 以 太 网 帧 格式 。 第 二 个 Wireshark 实验 研究 了 在 
家 庭 网 络 场景 下 所 获取 的 分 组 踪迹 。 
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Simon S. Lam 是 位 于 奥 斯 丁 的 得克萨斯 大 学 计算 机 科学 系 的 教授 和 
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事 卫 星 和 无 线 电 分 组 交换 方面 的 工作 。 他 领导 的 研究 组 于 1993 年 发 明了 
安全 套 接 字 及 其 原型 ， 这 是 第 一 个 安全 套 接 字 层 ( 称 为 安全 网 络 编程 )， 
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服务 的 设计 和 分 析 。 他 从 华盛顿 州立 大 学 获得 了 电气 工程 学 士 ( BSEE) 
学 位 ， 从 UCLA 获得 了 硕士 和 博士 学 位 。 他 于 2007 年 当选 美国 国家 工程 院 
院士 。 





Simon S: Lam 


。 为 什么 您 决定 专注 于 网 络 ? 

当 我 于 1969 年 秋季 作为 一 名 研究 生 新 生来 到 UCLA 时 ， 我 原来 的 意图 是 研究 控制 论 。 后 来 我 参加 了 
Leonard Kleinrock 的 排队 论 课程 ， 他 给 我 留 下 了 深刻 印象 。 不 久 后 ,我 以 排队 系统 的 自 适应 控制 作为 可 能 
的 论文 题目 进行 了 研究 。 在 1972 年 初 ， et 
星 ) 。Kleinrock 教授 请 我 参加 该 项 目 。 我 们 做 的 第 一 件 事 是 为 时 隙 ALOHA 协议 引入 一 个 简单 而 实用 的 回 
退 算法 。 不 久 后 ， lr A yp attr ip ra 
这 些 形 成 了 我 学 位 论文 的 核心 。 

© 20 世纪 70 年 代 您 开始 了 在 UCLA 的 学 生生 涯 ,活跃 于 因特网 的 早期 阶段 。 那 时 的 情况 怎样 ? 那 

时 人 们 对 因特网 将 变 成 什么 样 有 哪些 大 致 想法 ? 

那 时 的 环境 与 我 曾 在 产业 界 和 学 术 界 所 见 到 的 其 他 系统 构建 项 目的 确 没什么 不 同 。ARPAnet 初始 规 
定 的 目标 是 相当 谨慎 的 ， 即 提供 从 远程 位 置 接 人 昂贵 的 计算 机 的 手段 ， 使 许多 科学 家 能 够 使 用 这 些 计算 
机 。 然 而 ， 随 着 分 组 卫星 项 目 于 1972 年 和 分 组 无 线 电 项 目 于 1973 年 启动 ，ARPA 的 目标 有 了 相当 大 的 扩 
展 。 到 了 1973 年 ，ARPA 同时 建造 了 3 个 不 同 的 分 组 网 络 ， 对 Vint Cerf 和 Bob Kahn 来 说 研发 互联 策略 变 
得 有 必要 了 。 

回顾 过 去 ， 所 有 这 些 网 络 方 面 的 进步 和 进展 被 视 为 (我 相信 ) 符合 逻辑 的 而 不 是 虚幻 的 。 没 有 人 能 
够 想象 到 今天 的 因特网 规模 和 个 人 计算 机 的 能 力 。 在 第 一 台 PC 出 现 之 前 有 十 多 年 时 间 。 那 时 为 了 正确 
地 做 处 理 ， 多 数学 生 以 一 系列 穿孔 卡片 的 形式 提交 他 们 的 计算 机 程序 以 进行 批 处 理 。 仅 有 某 些 学 生 能 够 
直接 接触 计算 机 ， 而 计算 机 通常 位 于 一 个 受 限 的 区 域 中 。 调 制 解 调 器 速度 缓慢 且 稀 有 。 作 为 一 名 研究 生 ， 
在 书桌 上 我 仅 有 一 部 电话 机 ， 使 用 铅笔 和 纸 从 事 我 的 大 部 分 工作 。 

。 您 认为 网 络 和 因特网 未 来 将 往 何 处 发 展 ? 

在 过 去 ， 因 特 网 全 协 议 的 简单 性 是 它 在 竞争 上 取胜 的 最 大 法 宝 ， 并 且 成 为 网 络 互联 事实 上 的 标 
准 。 与 它 的 竞争 对 手 如 20 世纪 80 年 代 的 X. 25 和 20 世纪 90 年 代 的 ATM RE, IP 能 够 在 任何 链 路 层 
联网 技术 之 上 运行 ， 因 为 它 仅 提 供 尽力 而 为 的 数据 报 服务 。 因 此 ,任何 分 组 网 络 都 能 够 连接 到 因 特 
网 上 。 

SR, IP 的 最 大 长 处 实际 上 成 了 一 种 缺点 。IP 目前 像 一 件 紧身 衣 ， 限 制 了 因特网 向 特定 方向 发 展 。 
近年 来 , 许多 研究 人 员 仅 将 他 们 的 努力 重新 定向 到 应 用 层 上 。 在 无 线 自 组 织 网 络 、 传 感 网 络 和 卫星 网 络 
方面 也 做 了 大 量 研究 工作 。 这 些 网 络 能 够 看 作 独 立 的 系统 或 链 路 层 系 统 ， 因 为 位 于 下 的 紧身 衣 之 外 ， 所 
以 它们 能 够 繁荣 发 展 。 

许多 人 对 于 P2P 系统 可 能 作为 新 奇 的 因特网 应 用 的 平台 而 感到 欢欣 鼓舞 。 然 而 ，P2P 系统 在 使 用 因 
特 网 资源 方面 效率 很 低 。 我 关注 的 一 个 问题 是 ， 随 着 因特网 不 断 互 联 各 种 设备 和 支持 未 来 的 P2P 使 能 的 
应 用 ， 因 特 网 核心 的 传输 和 交换 能 力 比 起 对 因特网 流量 的 需求 来 说 ， 前 者 是 否 将 更 快 地 不 断 增加 。 没 有 
大 量 的 容量 预 留 ， 在 面临 恶意 攻击 和 拥塞 时 ， 确 保 网 络 稳定 性 将 是 一 项 重要 的 任务 。 

因特网 的 急剧 增长 也 要 求 以 高 速率 为 全 世界 的 网 络 操作 者 和 企业 分 配 新 的 IP 地 址 。 以 当前 速度 ， 
未 分 配 的 卫 地 址 池 将 在 几 年 内 消耗 殉 尽 。 当 该 事件 发 生 时 ， 仅 能 从 IPv6 地 址 空间 中 分 配 大 量 地 址 空间 
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的 相 邻 块 了 。 因 为 IPv6 采用 的 启动 缓慢 ， 由 于 对 早期 用 户 缺 乏 激 励 ， 所 以 IPv4 和 卫 v6 将 很 有 可 能 在 
今后 的 因特网 上 共存 很 多 年 。 从 IPv4 主宰 的 因特网 向 IPv6 主宰 的 因特网 迁移 将 需要 全 球 做 出 巨大 的 
努力 。 

© 您 的 工作 最 具 挑 战 性 的 部 分 是 什么 ? 

我 的 工作 最 具 挑 战 性 的 部 分 是 ， 作 为 一 名 教授 传授 和 激发 我 课堂 上 的 每 个 学 生 以 及 我 所 指导 的 每 个 
博士 研究 生 ， 而 不 只 是 获得 重要 的 成 就 。 非 常 聪明 和 有 学 习 动力 的 人 可 能 要 求 少量 的 引导 而 非 许多 其 他 
东西 。 我 经 常 从 学 生 那 里 学 到 很 多 东西 ， 比 他 们 从 我 这 里 学 到 的 多 。 教 育 和 激励 学 术 上 落后 的 学 生 是 一 
项 重要 的 挑战 。 

© 您 能 预见 到 技术 对 未 来 学 习 方 面 有 哪些 影响 ? 

最 终 几乎 所 有 的 人 类 知识 将 可 以 通过 因特网 得 到 ， 因 特 网 将 成 为 最 为 强 有 力 的 学 习 工具 。 这 种 巨大 
的 知识 库 将 具有 为 全 世界 的 学 生 们 提供 公平 竞争 环境 的 潜力 。 例 如 ， 任 何 国家 的 有 上 进 心 的 学 生 将 能 够 
访问 最 好 课程 的 Web 站 点 、 多 媒体 演讲 和 教学 材料 。 据 说 IEEE 和 ACM 数字 图 书馆 已 经 加 速 了 中 国 的 计 
算 机 科学 研究 的 发 展 。 与 此 同时 ， 因 特 网 将 超越 所 有 学 习 的 地 理 障 碍 。 


第 7 章 | 
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在 电话 技术 领域 ， 过 去 的 20 年 无 疑 可 认为 是 蜂窝 电话 技术 的 黄金 发 展期 。 全 球 范围 
的 移动 蜂 罕 电话 用 户 数量 从 1993 年 的 3400 万 增长 到 2014 年 的 超过 70 1Z, 同时 蜂窝 电话 
用 户 数量 现在 也 超过 了 有 线 电 话 用 户 数量 。 现 在 移动 电话 的 订购 数量 比 我 们 地 球 上 的 人 口 
数量 还 要 多 。 蜂 窝 电 话 的 许多 优点 是 显而易见 的 ， 通 过 一 个 移动 性 强 、 重 量 轻 的 设备 ， 能 
在 任何 地 方 、 任 何 时 间 无 颖 地 接 人 全 球 电话 网 络 。 最 近 ， 便 携 机 、 智 能 手机 和 平板 电脑 能 
够 以 无 线 方式 经 过 蜂窝 网 或 WiFi 网 络 连 接 到 因特网 ， 而 且 ， 如 游戏 机 、 人 恒温 调节 器 、 家 
庭 安 全 系统 、 家 用 器 具 、 手 表 、 眼 镜 、 汽 车、 流量 控制 系统 等 设备 也 越 来 越 多 地 以 无 线 方 
式 连 接 到 因特网 。 

从 网 络 的 观点 来 说 ， 由 这 些 无 线 和 移动 设备 联网 所 引发 的 挑战 ， 特 别 是 在 数据 链 路 层 
和 网 络 层 ， 与 传统 的 有 线 网 络 的 差别 非常 大 ， 适 合用 单独 一 章 (MAE) 的 篇 幅 来 专门 讨 
论 无 线 网 络 和 移动 网 络 。 

在 本 章 中 ， 我 们 首先 讨论 移动 用 户 、 无 线 链 路 和 网 络 ， 以 及 它们 与 所 连接 的 更 大 网 络 
(通常 是 有 线 网 络 ) 之 间 的 关系 。 我 们 将 指出 以 下 两 方面 的 差别 : 一 个 是 在 该 网 络 中 由 通 
信 链 路 的 无 线 特性 所 带 来 的 挑战 ， 另 一 个 是 由 这 些 无 线 链 路 使 能 的 移动 性 。 在 无 线 和 移动 
性 之 间 做 重要 区 分 ， 使 我 们 能 更 好 地 区 分 、 标 识 和 掌握 在 每 个 领域 中 的 重要 概念 。 值 得 注 
意 的 是 ， 确 实在 许多 网 络 环境 中 网 络 节点 是 无 线 的 而 不 是 移动 的 〈 例 如 具有 固定 工作 站 和 
大 显示 器 的 无 线 家 庭 或 办 公 网 络 ) ， 而 有 限 的 移动 性 也 并 不 要 求 用 无 线 链 路 〈 例 如 ， 一 个 
在 家 里 使 用 便携 机 的 员工 ， 关 闭 便携 机 ， 开 车 去 工作 ， 然 后 将 该 便携 机 连接 到 公司 的 有 线 
网 络 上 ) 。 当 然 ， 许 多 最 让 人 激动 的 网 络 环境 是 那些 让 用 户 同时 具有 无 线 和 移动 性 的 网 络 
环境 。 例 如 在 下 列 情况 下 ， 一 个 移动 用 户 (不 妨 假设 其 正 坐 在 汽车 后 座 上 ) 维持 一 个 卫 
语音 呼叫 和 多 个 进行 中 的 TCP 连接 ， 同 时 又 以 每 小 时 160 公里 的 速度 飞驰 在 高 速 公路 上 。 
正 是 在 这 种 具有 无 线 和 移动 的 交集 的 场合 中 ,我 们 将 会 发 现 最 有 趣 的 技术 挑战 。 

首先 我 们 将 说 明 用 于 考虑 无 线 通 信和 移动 性 的 环境 ， 即 无 线 (并 可 能 是 移动 ) 用 户 通 
过 位 于 网 络 边缘 的 无 线 链 路 连接 进 更 大 的 网 络 基 础 设施 的 网 络 。 然 后 在 7. 2 节 中， 我们 考 
虑 这 种 无 线 链 路 的 特性 ， 还 将 包括 一 个 对 码 分 多 址 接 人 (Code Division Multiple Access, 
CDMA) 的 简要 介绍 。CDMA 是 一 个 在 无 线 网 络 中 经 常 使 用 的 共享 媒体 接 人 协议 。 在 7.3 
节 中 ， 我 们 将 更 为 深入 地 分 析 IEEE 802.11 (WiFi) 无 线 LAN 标准 的 链 路 级 方面 ;同时 我 
们 还 将 对 蓝牙 和 其 他 无 线 个 人 域 网 络 做 简要 描述 。 在 7.4 节 中 , 我们 概述 蜂 帘 因 特 网 接 
入 ， 其 中 包括 3G 和 正在 兴起 的 4G 蜂窝 技术 ， 这 些 技术 能 够 同时 提供 语音 和 高 速 因特网 
接 人 。 在 7.5 节 ， 我 们 将 注意 力 转向 移动 性 ， 关 注 于 移动 用 户 的 定位 问题 、 对 移动 用 户 的 
路 由 选择 以 及 “切换 ”(handing off) 移动 用 户 〈 即 在 网 络 中 从 一 个 接 人 点 动态 地 移动 到 
另 一 点 的 用 户 ) 等 问题 。 在 7.6 节 和 7.7 节 中 ， 我们 将 分 别 考察 如 何在 企业 802. 11 网 络 
和 LTE 蜂 窜 网络 中 用 移动 IP 标准 实现 这 些 移动 服务 。 最 后 ， 我 们 将 在 7.8 节 中 考虑 无 线 
链 路 和 移动 性 对 运输 层 协议 和 网 络 应 用 程序 的 影响 。 
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7.1 概述 


图 7-1 显示 了 我 们 将 要 讨论 无 线 数据 通信 和 移动 性 主题 的 环境 。 为 使 讨论 具有 一 般 性 

以 覆盖 各 种 各 样 的 网 络 ， 将 包括 像 _ 

IEEE 802. 11 这 样 的 无 线 局 域 网 和 像 4G 

网 络 这 样 的 蜂窝 网 络 来 开始 我 们 的 讨 

论 ; 然后 在 后 续 各 节 中 ， 我们 将 对 特定 

的 无 线 体系 结构 进行 更 加 详细 的 讨论 。 

我 们 能 够 看 到 无 线 网 络 的 下 列 要 素 : 

。 无 线 主机 。 如 同 在 有 线 网 络 中 。 图例: 
一 样 ， 主 机 是 运行 应 用 程序 的 “ 饼 AR 
端 系统 设备 。 无 线 主机 (wire <p 
less host) 可 以 是 便携 机 、 掌 上 u enue 
机 < 智能 手机 或 者 桌面 计算 机 。 Be 运动 中 的 无 线 主机 
主机 本 身 可 能 移动 ， 也 可 能 不 @ wane 
移动 。 
。 无 线 链 路 。 主 机 通过 无 线 通 信 加 9-1 EE 

链 路 (wireless communication link) 连接 到 一 个 基站 (定义 见 下 文 ) 或 者 另 一 台 无 
线 主机 。 不 同 的 无 线 链 路 技术 具有 不 同 的 传输 速率 和 能 够 传输 不 同 的 距离 。 图 7-2 
显示 了 较为 流行 的 无 线 链 路 标准 的 两 种 主要 特性 (覆盖 区 域 和 链 路 速率 ) 。 (该 图 
仅 表示 了 提供 这 些 特性 的 大 致 概念 。 例 如 ， 这 些 类 型 中 的 某 些 网 络 现在 只 是 在 部 
署 ， 某 些 链 路 速率 取决 于 距离 、 信 道 条 件 和 在 无 线 网 络 中 的 用 户 数量 ， 能 够 比 显 
示 的 值 更 高 或 更 低 些 。) 我 们 将 在 本 章 的 前 半 部 分 讨论 这 些 标准 。 在 7.2 节 中 , 我 
们 也 考虑 其 他 无 线 链 路 特性 〈 如 它们 的 比特 差错 率 及 其 原因 ) 。 














384kbps 





室内 室外 室外 中 等 距离 。 室外 长 距离 
10 ~ 30m 50~200m 200~4000m = S~20km 


图 7-2 部 分 无 线 网 络 标准 的 链 路 特性 
在 图 7-1 中 ， 无 线 链 路 将 位 于 网 络 边缘 的 主机 连接 到 更 大 的 网 络 基础 设施 中 。 我 
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们 要 马上 补充 的 是 ， 无 线 链 路 有 时 同样 应 用 在 一 个 网 络 中 以 连接 路 由 器 、 交 换 机 和 其 他 网 
络 设备 。 然 而 ， 在 本 章 中 我 们 关注 的 焦点 是 无 线 通信 在 网 络 边缘 的 应 用 ， 因 为 许多 最 为 振 
奋 人 心 的 技术 挑战 和 多 数 增长 就 发 生 在 这 里 。 
e 基站 。 基 站 (base station) 是 无 线 网 络 基础 设施 的 一 个 关键 部 分 。 与 无 线 主机 和 
无 线 链 路 不 同 ， 基 站 在 有 线 网 络 中 没有 明确 的 对 应 设备 。 它 负责 向 与 之 关联 的 无 
线 主 机 发 送 数据 和 从 主机 那里 接收 数据 (例如 分 组 )。 基 站 通常 负责 协调 与 之 相关 
联 的 多 个 无 线 主机 的 传输 。 当 我 们 说 一 台 无 线 主机 与 某 基 站 “相关 联 ” 时 ， 则 是 
指 : 中 该 主机 位 于 该 基站 的 无 线 通信 覆盖 范围 内 ; @@ 该 主机 使 用 该 基站 中 继 它 
(该 主机 ) 和 更 大 网 络 之 间 的 数据 。 蜂 窝 网 络 中 的 蜂窝 塔 (cell tower) 和 802. 11 
无 线 LAN 中 的 接 入 点 (access point) 都 是 基站 的 例子 。 
在 图 7-1 中 ， 基 站 与 更 大 网 络 相连 (如 因特网 、 公 司 或 家 庭 网 、 电 话 网 ) ， 因 此 这 种 
连接 在 无 线 主机 和 与 之 通信 的 其 他 部 分 之 间 起 着 链 路 层 中 继 的 作用 。 
与 基站 关联 的 主机 通常 被 称 为 以 基础 设施 模式 (infrastructure mode) 运行 ， 因 为 所 有 
传统 的 网 络 服务 (如 地 址 分 配 和 路 由 选择 ) 都 由 网 络 向 通过 基站 相连 的 主机 提供 。 在 自 组 
织 网 络 (ad hoc network) 中 ， 无 线 主机 没有 这 样 的 基础 设施 与 之 相连 。 在 没有 这 样 的 基础 
设施 的 情况 下 ， 主 机 本 身 必须 提供 诸如 路 由 选择 、 地 址 分 配 、 类 似 于 DNS 的 名 字 转 换 等 
服务 。 
当 一 台 移 动 主机 的 移动 超出 一 个 基站 的 覆盖 范围 而 到 达 另 一 个 基站 的 覆盖 范围 后 ， 它 
将 改变 其 接 人 到 更 大 网 络 的 连接 点 〈( 即 改变 与 之 相关 联 的 基站 ) ， 这 一 过 程 称 作 切 换 
(handoff) 。 这 种 移动 性 引发 了 许多 具有 挑战 性 的 问题 。 如 果 一 台 主 机 可 以 移动 ， 那 么 如 何 
找到 它 在 网 络 中 的 当前 位 置 ， 从 而 使 得 数据 可 以 向 该 移动 主机 转发 ”如 果 一 台 主 机 可 以 位 
于 许多 可 能 位 置 中 的 一 个 ， 那 么 如 何 进行 编 址 ?如 果 主 机 在 一 个 TCP 连接 或 者 电话 呼叫 期 
间 移 动 ， 数 据 如 何 路 由 选择 而 使 连接 保持 不 中 断 ? 这 些 以 及 许多 (许多 !) 其 他 问题 使 得 
无 线 网 络 和 移动 网 络 成 为 一 个 让 人 振奋 的 网 络 研 究 领 域 。 
e 网 络 基础 设施 。 这 是 无 线 主 机 希望 与 之 进行 通信 的 更 大 网 络 。 
在 讨论 完 无 线 网 络 的 构件 以 后 ， 我 们 注意 到 这 些 构件 能 够 以 多 种 不 同方 式 组 合 以 形成 
不 同类 型 的 无 线 网 络 。 当 阅读 本 章 ， 或 阅读 /学 习 本 书 之 外 的 更 多 有 关 无 线 网 络 的 内 容 时 ， 
你 可 能 发 现 对 这 些 无 线 网 络 类 型 进行 分 类 的 方法 是 有 用 的 。 在 最 高 层次 ， 我 们 能 够 根据 两 
个 准则 来 对 无 线 网 络 分 类 : 中 在 该 无 线 网 络 中 的 分 组 是 否 跨越 了 一 个 无 线 跳 或 多 个 无 线 
BE; @) 网 络 中 是 否 有 诸如 基站 这 样 的 基础 设施 。 
°. 单 跳 ， 基 于 基础 设施 。 这 些 网 络 具 有 与 较 大 的 有 线 网 络 〈 如 因特网 ) 连接 的 基站 。 
此 外 ， 该 基站 与 无 线 主机 之 间 的 所 有 通信 都 经 过 一 个 无 线 跳 。 你 在 教室 、 咖 啡 屋 
或 图 书馆 中 所 使 用 的 802. 11 网 络 ， 以 及 我 们 将 很 快 学 习 的 4G LTE 数据 网 络 都 属 
于 这 种 类 型 。 我 们 上 日常 的 绝 大 部 分 时 间 是 在 与 单 跳 、 基 于 基础 设施 的 无 线 网 络 打 
交道 。 
© 单 跳 ， 无 基础 设施 。 在 这 些 网 络 中 ， 不 存在 与 无 线 网 络 相 连 的 基站 。 然 而 ， 如 我 
们 将 要 见 到 的 那样 ， 在 这 种 单 跳 网 络 中 的 一 个 节点 可 以 协调 其 他 节点 的 传输 。 蓝 
牙 网 络 (该 网 络 连接 诸如 键盘 、 扬 声 器 和 戴 在 头 上 的 耳机 等 小 型 无 线 设 备 ， 我 们 
将 在 7.3.6 节 中 学 习 ) 和 具有 自 组 织 模式 的 802.11 网 络 是 单 跳 、 无 基础 设施 的 
网 络 。 

e 多 跳 ， 基 于 基础 设施 。 在 这 些 网 络 中 ， 一 个 基站 表现 为 以 有 线 方式 与 较 大 网 络 相 
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连 。 然 而 ， 某 种 无 线 节 点 为 了 经 该 基站 通信 ， 可 能 不 得 不 通过 其 他 无 线 节 点 中 继 
它们 的 通信 。 某 些 无 线 传 感 网 络 和 所 谓 无 线 网 状 网 络 (wireless mesh network) 就 
属于 这 种 类 型 。 

© 多 跳 , 无 基础 设施 。 在 这 些 网 络 中 没有 基站 ， 并且 节点 为 了 到 达 目 的 地 可 能 必须 
在 几 个 其 他 无 线 节 点 之 间 中 继 报 文 。 节 点 也 可 能 是 移动 的 ， 在 多 个 节点 中 改变 连 
接 关 系 ， 一 类 网 络 被 称 为 移动 自 组 织 网 络 (mobile ad hoc network, MANET), 。 如 
果 该 移动 节点 是 车 载 的 ， 该 网 络 是 车 载 自 组 织 网 络 (vehicular ad hoc network, 
VANET) 。 如 你 可 能 想象 的 那样 ， 为 这 种 网 络 开 发 协议 是 一 种 挑战 ， 这 是 许多 进行 
中 的 研究 主题 。 

在 本 章 中 ， 我 们 将 把 主要 学 习 内 容 限制 在 单 跳 网 络 ， 并 且 大 多 数 是 基于 基础 设施 的 网 络 。 

现在 我 们 更 深 一 步 地 研究 无 线 网 络 和 移动 网 络 面 对 的 挑战 。 我 们 将 首先 讨论 单独 的 无 

线 链 路 ， 而 在 本 章 稍 后 部 分 讨论 移动 性 。 


公共 WiFi BA: 路 灯 方 案 很 快 将 实现 吗 ? 


WiFi AEA ( 即 用 户 能 够 找到 802. 11 无 线 接 入 的 公共 位 置 ) 在 全 世界 的 旅馆 、 机 场 
和 咖啡 屋 变 得 日 益 常 见 。 大 多 数 大 学 校园 提供 了 无 所 不 在 的 无 线 接 入 ， 找 一 个 不 提供 无 
线 因 特 网 接 入 的 旅馆 也 很 难 。 

在 过 去 的 十 年 中 ， 一 些 城市 已 经 设计 、 部 署 和 运行 了 市 政 的 Wiki 网 络 。 作 为 公共 
服务 (非常 像 街 灯 ) 提供 无 所 不 在 的 WiFi 接 入 到 社区 的 前 景 引 人 入 胜 ， 通 过 向 所 有 居 
民 提 供 因特网 接 入 ， 有 助 于 填 平 数字 鸿沟 ， 并 能 促进 经 济 发 展 。 世 界 上 的 许多 城市 ， 包 
括 费 城 、 香 港 、 明 尼 阿 波 利 斯、 伦敦 和 奥克兰 ， 已 经 计划 在 城市 中 提供 无 所 不 在 的 无 
| 线 ， 或 者 已 经 在 不 同 程度 上 做 到 了 这 一 点 。 美 国宾 夕 法 尼 亚 州 费城 的 目标 是 “将 费城 变 
为 国家 最 大 的 WiFi 热 区 ， 有 助 于 改善 教育 ， 填 平 数字 鸿沟 ， 增 强 邻 居 交 往 ， 以 及 减少 
政府 成 本 ”。 这 项 雄心 勃勃 的 规划 依据 该 城市 、 无 线 费 城 (一 个 非 营利 组 织 ) 和 因特网 
服务 提供 商 Earthlink 达成 的 一 项 协议 ， 这 将 在 履 盖 城市 80 多 区域 的 街道 路 灯 杆 和 交通 
控制 设备 上 建设 一 个 802. 11b 热 区 的 运行 网 络 。 而 由 该 网 络 产生 的 金融 和 运行 股份 在 
2008 年 出 售 给 了 一 群 私 人 投资 者 ， 他 们 在 2010 年 再 将 该 网 络 回 售 给 该 城市 。 其 他 城市 
如 明 尼 阿 波 利 斯 、 多 伦 多 、 香 港 、 伦 敦 和 奥克兰 已 经 取得 了 较 小 规模 的 成 功 。 

运行 在 无 须 许 可 证 的 频谱 上 (因此 能 够 在 无 须 购买 昂贵 的 频谱 使 用 权 的 情况 下 部 
署 ) 的 802.11 网 络 看 起 来 使 其 在 资金 上 具有 吸引 力 。 然 而 ，802. 11 接 入 点 (参见 7.3 
节 ) 比 起 4G 蜂 窜 基 站 (参见 7.4 节 ) 缺少 大 量 的 频段 ， 要 求 部 署 大 量 的 端点 来 覆盖 相 
同 的 地 理 区 域 。 在 另 一 方面 ， 提 供 因 特 网 接 入 的 蜂窝 数据 网 络 运行 在 许可 证 频谱 上 。 蜂 
帘 提 供 商 为 其 网 络 的 频谱 接 入 权 支 付 数 十 亿美 元 ， 使 得 蜂窝 数据 网 络 是 商务 而 不 是 市 政 
事务 。 

a = | 











7.2 无 线 链 路 和 网 络 特征 
我 们 开始 考虑 用 一 台 有 线 以 太 网 交换 机 互联 主机 的 一 个 简单 有 线 网 络 ， 如 一 个 家 庭 网 
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络 (参见 6.4 节 )。 如 果 我 们 用 无 线 802. 11 网 络 代替 该 有 线 以 太 网 ， 用 无 线 网 络 接口 代替 
主机 的 有 线 以 太 网 接口 ， 用 接 人 点 代替 以 太 网 交换 机 ， 但 实际 上 在 网 络 层 及 其 以 上 层次 中 
不 需要 有 任何 变化 。 这 提示 我 们 当 寻 找 有 线 和 无 线 网 络 的 重要 区 别 时 ， 应 该 重点 关注 链 路 
层 。 我 们 的 确 能 够 发 现 有 线 链 路 和 无 线 链 路 间 的 许多 重要 区 别 : 
e 递减 的 信号 强度 。 电 磁 波 在 穿 过 物体 (如 无 线 电 信号 穿 过 墙壁 ) 时 强度 将 减弱 。 
即使 在 自由 空间 中 ， 信 号 仍 将 扩散 ， 这 使 得 信号 强度 随 着 发 送 方 和 接收 方 距离 的 
增加 而 减弱 (有 时 称 其 为 路 径 损 耗 (path loss) ) 。 
© 来 自 其 他 源 的 干扰 。 在 同一 个 频段 发 送信 号 的 电波 源 将 相互 干扰 。 例 如 ，2. 4GHz 无 
线 电话 和 802. 11b 无 线 LAN 在 相同 的 频段 中 传输 。 因 此 ，802. 11b 无 线 LAN 用 户 若 
同时 利用 2. 4GHz 无 线 电 话 通信 ， 将 会 导致 网 络 和 电话 都 不 会 工作 得 特别 好 。 除 了 来 
自发 送 源 的 和 干扰， 环境 中 的 电磁 噪声 〈 如 附近 的 电动 机 、 微 波 ) 也 能 形成 干扰 。 
© 多 径 传播 。 当 电磁 波 的 一 部 分 受 物体 和 地 面 反 射 ， 在 发 送 方 和 接收 方 之 间 走 了 不 
同 长 度 的 路 径 ， 则 会 出 现 多 径 传播 ( multipath propagation ) 。 这 使 得 接收 方 收 到 的 
信号 变 得 模糊 。 位 于 发 送 方 和 接收 方 之 间 的 移动 物体 可 导致 多 径 传播 随时 间 而 
改变 。 
对 于 无 线 信道 特征 、 模 型 和 测量 的 详细 讨论 请 参见 [ Anderson 1995 ] 。 
上 述 讨 论 表明 ， 无 线 链 路 中 的 比特 差错 将 比 有 线 链 路 中 更 为 常见 。 因 此 ， 无 线 链 路 协 
议 〈 如 我 们 将 在 下 面 一 节 中 讨论 的 802. 11 协议 ) 不 仅 采用 有 效 的 CRC 错误 检测 码 ， 还 采 
用 了 链 路 层 ARQ 协议 来 重 传 受 损 的 帧 。 

考虑 了 在 无 线 信道 上 可 能 出 现 的 损伤 后 ， 我 们 将 注意 力 转向 接收 无 线 信 号 的 主机 。 
该 主机 接收 到 一 个 电磁 信号 ， 而 该 信号 是 发 送 方 传输 的 初始 信号 的 退化 形式 和 环境 中 的 
背景 噪声 的 结合 ， 其 中 的 信号 退化 是 由 于 衰减 和 我 们 前 面 讨论 过 的 多 路 径 传播 以 及 其 他 
一 些 因素 所 引起 的 。 信 了 噪 比 (Signal-to- Noise Ratio, SNR) 是 所 收 到 的 信号 (如 被 传输 
的 信息 ) 和 噪声 强度 的 相对 测量 。SNR 的 度量 单位 通常 是 分 贝 (dB) ， 有 人 认为 这 个 主 
要 由 电气 工程 师 所 使 用 的 度量 单位 会 使 计算 机 科学 家 迷惑 不 解 。 以 dB 度量 的 SNR 是 下 
列 比值 的 20 倍 ， 即 接收 到 的 信号 的 振幅 与 噪声 的 振幅 的 以 10 为 底 的 对 数 的 比值 。 就 我 
们 的 讨论 目的 而 言 ， 我 们 仅 需 要 知道 较 大 的 SNR 使 接收 方 更 容易 从 背景 噪声 中 提取 传 
输 的 信号 。 

图 7-3 (该 图 选 自 [Holland 2001]) 显示 10 


了 三 种 不 同 的 调制 技术 的 比特 差错 率 (BER) Neue ae 
(大 致 说 来 ，BER 是 在 接收 方 收 到 的 有 错 传输 = BPSK \ \ 
比特 的 概率 ) 与 SNR 之 比 ， 这 些 调制 技术 用 于 io |0) 


对 信息 进行 编码 以 在 理想 信道 上 传输 。 调 制 和 
编码 理论 以 及 信号 提取 和 BER 都 超出 了 本 书 的 
范围 (对 这 些 主 题 的 讨论 参见 [ Schwart 
1980] ) 。 尽 管 如 此 ， 图 7-3 显示 了 几 种 物理 层 的 
特征 ， 这 些 特 征 对 于 理解 较 高 层 无 线 通信 协议 
是 重要 的 : 
e 对 于 给 定 的 调制 方案 ，SNR 越 高 ，BER 
越 低 。 由 于 发 送 方 通过 增加 它 的 传输 功 
率 就 能 够 增加 SNR， 因 此 发 送 方 能 够 通 图 7-3 ”比特 差错 率 、 传 输 率 和 SNR 
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过 增加 它 的 传输 功率 来 降低 接收 到 差错 帧 的 概率 。 然 而 ， 注 意 到 当 该 功率 超过 某 
ABER, Gn BER 从 10 一 降 低 到 10 -”， 可 证 明 几 乎 不 会 有 实际 增益 。 增 加 传输 
功率 也 会 伴随 着 一 些 缺点 : 发 送 方 必须 消耗 更 多 的 能 量 (对 于 用 电池 供电 的 移动 
HP, 这 一 点 非常 重要 ) ， 并 且 发 送 方 的 传输 更 可 能 干扰 男 一 个 发 送 方 的 传输 ( 参 


见 图 7-4b) o 
<)> «>> (< >> 
A B © 


信号 强度 





a) 隐藏 终端 问题 b) 衰减 
图 7-4 隐藏 终端 问题 和 衰减 


e 对 于 给 定 的 SNR， 具 有 较 高 比特 传输 率 的 调制 技术 (无论 差错 与 否 ) 将 具有 较 高 
的 BER。 例 如 在 图 7-3 中 ,对 于 10dB 的 SNR, BA 1Mbps 传输 速率 的 BPSK 调制 
具有 小 于 10 一 的 BER， 而 具有 4Mbps 传输 速率 的 QAM 16 调制 ，BER Æ 107, i% 
值 太 高 而 没有 实际 用 处 。 然 而 ， 具 有 20dB 的 SNR，QAM 16 调制 具有 4Mbps 的 传 
HERA 10 一 的 BER， 而 BPSK 调制 具有 仅 1Mbps 的 传输 速率 和 一 个 低 得 “无 法 
在 图 上 表示 ”的 BER。 如 果 人 们 能 够 容忍 107 HJ BER， 在 这 种 情况 下 由 QAM 16 
提供 的 较 高 的 传输 速率 将 使 它 成 为 首选 的 调制 技术 。 这 些 考虑 引出 了 我 们 下 面 描 
述 的 最 后 一 个 特征 。 | 
© 物理 层 调制 技术 的 动态 选择 能 用 于 适 配 对 信道 条 件 的 调制 技术 。SNR (因此 BER) 
可 能 因 移 动 性 或 由 于 环境 中 的 改变 而 变化 。 在 蜂窝 数据 系统 中 以 及 在 802. 11 WiFi 
和 4G 蜂 帘 数据 网 络 中 (我 们 将 在 7.3 节 和 7.4 节 中 学 习 ) 使 用 了 自 适应 调制 和 编 
码 。 例 如 ， 这 使 得 对 于 给 定 的 信道 特征 选择 一 种 调制 技术 ， 在 受制 于 BER 约束 的 
前 提 下 提供 最 高 的 可 能 传输 速率 。 
有 线 和 无 线 链 路 之 间 的 差异 并 非 仅 仅 只 有 较 高 的 、 时 变 的 误 比 特 率 这 一 项 。 前 面 讲 
过 在 有 线 广 播 链 路 中 所 有 节点 能 够 接收 到 所 有 其 他 节点 的 传输 。 而 在 无 线 链 路 中 ， 情 况 
并 非 如 此 简单 。 如 图 7-4 所 示 ， 假 设 站 点 A 正在 向 站 点 B 发送 ,同时 假定 站 点 C 也 在 向 
站 点 B 传输 。 由 于 所 谓 的 隐藏 终端 问题 (hidden terminal problem) ， 即 使 A 和 C 的 传输 
确实 是 在 目的 地 B 发 生 干 扰 ， 环 境 的 物理 阻挡 (例如 ， 一 座 大 山 或 者 一 座 建筑 ) 也 可 
能 会 妨碍 A 和 C 互相 听 到 对 方 的 传输 。 这 种 情况 如 图 7-4a 所 示 。 第 二 种 导致 在 接收 方 
无 法 检测 的 碰撞 情况 是 ， 当 通过 无 线 媒体 传播 时 信号 强度 的 衰减 〈fading) 。 图 7-4b 图 
示 了 这 种 情况 ，A 和 C 所 处 的 位 置 使 得 它们 的 信号 强度 不 足以 使 它们 相互 检测 到 对 方 的 
传输 ， 然 而 它们 的 传输 足以 强 到 在 站 点 B 处 相互 干扰 。 正 如 我 们 将 在 7.3 节 看 到 的 那 
样 ， 隐 藏 终端 问题 和 衰减 使 得 多 路 访问 在 无 线 网 络 中 的 复杂 性 远 高 于 在 有 线 网 络 中 的 
情况 。 
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CDMA 


在 第 6 章 讲 过 ， 当 不 同 主机 使 用 一 个 共享 媒体 通信 时 ， 需 要 有 一 个 协议 来 保证 多 个 发 
送 方 发 送 的 信号 不 在 接收 方 互 相干 扰 。 在 第 6 章 中 ， 我们 描述 了 3 类 媒体 访问 协议 : 信道 
划分 、 随 机 访问 和 轮流 。 码 分 多 址 ( Code Division Multiple Access, CDMA) 属于 信道 划分 
协议 族 。 它 在 无 线 LAN 和 蜂窝 技术 中 应 用 很 广泛 。 由 于 CDMA 对 无 线 领域 十 分 重要 ， 在 
后 面 小 节 中 对 具体 的 无 线 接 入 技术 进行 探讨 以 前 ， 我 们 首先 对 其 快速 地 浏览 一 下 。 

在 CDMA 协议 中 ， 要 发 送 的 每 个 比特 都 通过 乘 以 一 个 信号 (编码 ) 的 比特 来 进行 编 
码 ， 这 个 信号 的 变化 速率 (通常 称 为 码 片 速率 ，chipping rate) 比 初始 数据 比特 序列 的 变 
化 速率 快 得 多 。 图 7-5 表示 一 个 简单 的 、 理 想 化 的 CDMA 编码 /解码 情形 。 假 设 初始 数据 
比特 到 达 CDMA 编码 器 的 速率 定义 了 时 间 单 元 ; 也 就 是 说 ， 每 个 要 发 送 的 初始 数据 比特 需 
要 1 比特 时 隙 时 间 。 设 d; 为 第 i 个 比特 时 隙 中 的 数据 比特 值 。 为 了 数学 上 便利 ,我 们 把 具 
有 0 值 的 数据 比特 表示 为 -1。 每 个 比特 时 隙 又 进一步 细 分 为 M 个 微 时 际 ; 在 图 7-5 中 ， 
M =8， 不 过 在 实际 中 M 的 值 要 大 得 多 。 发 送 方 使 用 的 CDMA 编码 由 M 个 值 的 一 个 序列 cw 
组 成 , =1,…，M， 每 个 取 值 为 +1 或 者 -1。 在 图 7-5 的 例子 中 ,被 发 送 方 使 用 的 M 
比特 的 CDMA 码 是 (1, 1, 1, -1, 1, -1, -1, -1)。 i 





信道 输出 Z.。 


时 隙 0 
信道 输出 





图 7-5 一 个 简单 的 CDMA 例子 : 发 送 方 编码 ， 接 收 方 解 码 
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为 了 说 明 CDMA 的 工作 原理 , 我们 关注 第 i 个 数据 比特 di 。 对 于 d; 比特 传输 时 间 
KH mAAR, CDMA 编码 器 的 输出 Zim 是 d;i 乘 以 分 配 的 CDMA 编码 的 第 m 比 
RE Cm: 

Zim = d; "Oa (7-1) 

简单 地 说 ， 对 没有 干扰 的 发 送 方 ， 接 收 方 将 收 到 编码 的 比特 Z.。， 并 且 恢 复 初 始 的 数 
据 比 特 d; ， 计 算 如 下 : 


1 M 
d; = Me Zim Cn (7-2) 


读者 可 能 想 通 过 推荐 图 7-5 所 示例 子 的 细节 ， 来 明白 使 用 式 (7-2) 在 接收 方 确实 正确 恢 
复 了 初始 数据 比特 。 

然而 ， 这 个 世界 远 不 是 理想 化 的 ， 如 上 面 所 述 ，CDMA 必须 在 存在 干扰 发 送 方 的 情况 
下 工作 ， 这 些 发 送 方 用 分 配 的 不 同 编码 来 编码 和 传输 它们 的 数据 。 但 是 当 一 个 发 送 方 的 数 
据 比 特 和 其 他 发 送 方 发 送 的 比特 混在 一 起 时 ， 一 个 CDMA 接收 方 怎样 恢复 该 发 送 方 的 初始 
数据 比特 呢 ? CDMA 的 工作 有 一 种 假设 ， 即 对 干扰 的 传输 比特 信号 是 加 性 的 ， 这 意味 着 ， 
例如 在 同一 个 微 时 隙 中 ， 如 果 3 个 发 送 端 都 发 送 1， 第 4 个 发 送 端 发 送 -1， 那 么 在 那个 微 
时 隙 中 所 有 的 接收 方 接收 的 信号 都 是 2 (因为 1+1+1 -1=2)。 在 存在 多 个 发 送 方 时 ， 发 
送 方 * 计算 它 编码 后 的 传输 Zr。， 计 算 方式 与 式 〈7-1) 中 的 完全 相同 。 然 而 在 第 i 个 比特 
时 隙 的 第 m 个 微 时 隙 期 间 ， 接 收 方 现在 收 到 的 值 是 在 那个 微 时 隙 中 从 所 有 N 个 发 送 方 传 
输 的 比特 的 总 和 : 


Zim = > Zin 
令 人 吃惊 的 是 ， 如 果 仔 细 地 选择 发 送 方 的 编码 ， 每 个 接收 方 只 通过 式 (7-2) 中 的 


同样 的 方式 使 用 发 送 方 的 编码 ， 就 能 够 从 聚合 的 信号 中 恢复 一 个 给 定 的 发 送 方 发 送 的 
数据 : 


a a 
d, = MO Zn (7-3) 
如 在 图 7-6 中 所 示 ， 描 述 了 两 个 发 送 方 的 CDMA 例子 。 上 部 的 发 送 方 使 用 的 M 比特 
CDMA 编码 是 (1; 1, 1, -1, 1，-1，-1，-1)， 而 下 部 的 发 送 方 使 用 的 CDMA 编码 
Æ (1, -1, 1, 1, 1, -1, 1, 1)s 图 7-6 描述 了 一 个 接收 方 恢复 从 上 部 发 送 方 发 送 的 


初始 数据 比特 的 情况 。 注 意 到 这 个 接收 方 能 够 提取 来 自发 送 方 1 的 数据 ， 而 不 管 来 自发 送 
方 2 的 干扰 传输 。 

再 回 到 我 们 第 6 章 中 鸡尾酒 会 的 类 比 ， 一 个 CDMA 协议 类 似 于 让 聚会 客人 使 用 多 种 语 
言 来 谈论 ; 在 这 种 情况 下 ， 人 们 实际 上 非常 善于 锁定 他 们 能 听 懂 的 语言 的 谈话 ， 而 过 滤 了 
其 余 的 谈话 。 我 们 这 里 看 到 CDMA 是 一 个 划分 协议 ， 因 为 它 划 分 编码 空间 〈 与 时 间或 频 
率 相 对 ) ， 并 且 给 每 个 节点 分 配 一 段 专用 的 代码 空间 。 

我 们 这 里 对 CDMA 的 讨论 是 简要 的 ; 实践 中 还 必须 处 理 大 量 的 困难 问题 。 首 先 ， 为 了 
使 CDMA 接收 方 能 够 提取 一 个 特定 的 发 送 方 的 信号 ， 必 须 仔 细 地 选择 CDMA 编码 。 其 次 ， 
我 们 的 讨论 假设 在 接收 方 接收 到 的 来 自从 不 同 发 送 方 的 信号 强度 是 相同 的 ; 这 可 能 在 实际 
中 很 难 获 得 。 有 大 量 的 文章 讨论 了 有 关 CDMA 的 这 些 和 其 他 问题 ; 详细 内 容 见 [ Pickholtz 
1982; Viterbi 1995] 。 
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图 7-6 两 个 发 送 方 的 CDMA 例子 


7.3 WiFi: 802. 11 无 线 LAN 


当前 ， 无 线 LAN 在 工作 场所 、 家 庭 、 教 育 机 构 、 咖 啡 屋 、 机 场 以 及 街头 无 所 不 在 ， 
它 已 经 成 为 因特网 中 的 一 种 十 分 重要 的 接 人 网 技术 。 尽 管 在 20 世纪 90 年 代 研 发 了 许多 有 
KE LAN 的 标准 和 技术 ， 但 其 中 有 一 类 标准 已 经 明显 成 为 赢家 : IEEE 802.11 无 线 
LAN (也 称 为 WiFi) 。 在 本 节 中 ， 我 们 将 详细 研究 802.11 无 线 LAN， 分 析 它 的 帧 结构 、 
它 的 媒体 访问 协议 以 及 802. 11 LAN 与 有 线 以 太 网 LAN 的 互联 。 

在 IEEE 802.11 (“WiFi”) 协议 族 中 有 几 套 有 关 无 线 LAN 的 802. 11 标准 ， 表 7-1 中 
对 它们 进行 了 总 结 。 不 同 的 802. 11 标准 都 具有 某 些 共同 的 特征 。 它 们 都 使 用 相同 的 媒体 
访问 协议 CSMA/CA, 我们 稍 后 将 讨论 该 协议 。 这 些 标准 对 它们 的 链 路 层 帧 也 都 使 用 相同 
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的 帧 结构 ， 而 且 它 们 都 具有 减少 其 传输 速率 的 能 力 以 伸展 到 更 远 的 距离 。 并 且 重 要 的 是 ， 
802. 11 产品 也 都 是 向 后 兼容 的 ， 这 意味 着 例如 仅 支 持 802. 11g 的 移动 站 仍 可 以 与 较 新 的 
802. 11ac 基站 交互 。 
然而 ， 如 表 7-1 所 示 ， 这 些 标准 在 物理 表 7-1 IEEE 802. 11 标准 小 结 

层 有 一 些 重要 的 区 别 。802. 11 设备 工作 在 两 标准 
个 不 同 的 频率 段 上 : 2.4 ~2.485GHz ( 称 之 802. 11b 
为 2.4GHz 频段 ) 和 5.1 ~5.8GHz ( 称 之 为 
5GHz 频段 )。2. 4GHz 频段 是 一 种 无 须 执照 
的 频段 ， 在 此 频段 上 ,使 用 2.4GHz 的 电话 
和 微波 炉 等 802. 11 设备 可 能 会 争 用 该 频段 
的 频谱 。 在 5CHz 频段 ， 对 于 给 定 的 功率 等 
级 802. 11 LAN 有 更 短 的 传输 距离 ， 并 且 受 多 径 传播 的 影响 更 多 。 两 种 最 新 的 标准 802. 11n 
[ IEEE 802. 11n 2012] 和 802. 1lac [IEEE 802. 11ac 2013; Cisco 802. 11ac 2015] 使 用 多 输 
入 多 输出 (MIMO) 和 天线; 也 就 是 说 在 发 送 一 侧 的 两 根 或 更 多 的 天 线 以 及 在 接收 一 侧 的 两 
根 或 更 多 的 天 线 发 送 /接收 着 不 同 的 信号 [Diggavi 2004], 802. 11ac 基站 可 以 同时 向 多 个 
站 点 传输 ， 并 且 使 用 “智能 ”天 线 在 接收 方 的 方向 上 用 自 适 应 成 型 波束 向 目标 传输 。 这 减 
少 了 干扰 并 增 大 了 以 给 定数 据 率 传输 的 可 达 距 离 。 在 表 7-1 中 显示 的 数据 率 是 针对 理想 环 
境 的 数据 ， 例 如 一 个 离 基站 1 米 远 的 接收 方 没 有 干扰 ， 而 这 种 场景 在 实践 中 是 不 可 能 经 历 
到 的 ! 因此 正如 谚语 所 说 : 你 走 过 的 路 (或 者 此 时 是 你 的 无 线 数据 率 ) 也 许 是 变化 的 
(YMMV), 


7.3.1 802.11 体系 结构 


图 7-7 显示 了 802. 11 无 线 LAN 体系 结构 的 基本 构件 。802. 11 体系 结构 的 基本 构件 模 
块 是 基本 服务 集 (Basic Service Set，BSS ) 。 一 个 BSS 包含 一 个 或 多 个 无 线 站 点 和 一 个 在 
802. 11 术语 中 称 为 接 入 点 (Access Point, AP) 的 中 央 基 站 (base station ) 。 图 7-7 展示 了 
两 个 BSS 中 的 AP， 它 们 连接 到 一 个 互联 设备 上 〈 如 交换 机 或 者 路 由 器 ) ， 互 联 设 备 又 连接 
到 因特网 中 。 在 一 个 典型 的 家 庭 网 络 中 ， 有 一 个 AP 和 一 台 将 该 BSS 连接 到 因特网 中 的 路 
由 器 (通常 综合 成 为 一 个 单元 ) 。 

与 以 太 网 设备 类 似 ， 每 个 802. 11 无 线 站 点 都 具有 一 个 6 字 节 的 MAC 地 址 ， 该 地 址 存 
储 在 该 站 适配器 〈 即 802. 11 网 络 接口 卡 ) 的 固件 中 。 每 个 AP 的 无 线 接口 也 具有 一 个 
MAC 地 址 。 与 以 太 网 类 似 ， 这 些 MAC 地 址 由 IEEE 管理 ， 理 论 上 是 全 球 唯一 的 。 

如 7.1 节 所 述 ， 配 置 AP 的 无 线 LAN 经 常 被 称 作 基 础 设施 无 线 LAN (infrastructure 
wireless LAN) ， 其 中 的 “基础 设施 ”是 指 AP 连同 互联 AP 和 一 台 路 由 器 的 有 线 以 太 网 。 
图 7-8 显示 了 IEEE 802. 11 站 点 也 能 将 它们 自己 组 合 在 一 起 形成 一 个 自 组 织 网 络 ， 即 一 个 
无 中 心 控 制 和 与 “外 部 世界 ”无 连接 的 网 络 。 这 里 ， 该 网 络 是 由 彼此 已 经 发 现 相 互 接近 且 
有 通信 需求 的 移动 设备 “动态 ”形成 ， 并 且 在 它们 所 处 环境 中 没有 预先 存在 的 网 络 基础 设 
施 。 当 携带 便携 机 的 人 们 聚集 在 一 起 时 〈 例 如 ， 在 一 个 会 议 室 、 一 列 火 车 或 者 一 辆 汽车 
中 ) ， 并 且 要 在 没有 中 央 化 的 AP 的 情况 下 交换 数据 ， 一 个 自 组 织 网 络 就 可 能 形成 了 。 随 
着 要 通信 的 便携 设备 的 继续 激增 ， 人 们 对 自 组 织 网 络 产生 巨大 的 兴趣 。 然 而 在 本 节 中 ， 我 
们 只 关注 基础 设施 无 线 LAN。 
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信道 与 关联 

在 802. 11 中 ， 每 个 无 线 站 点 在 能 够 发 送 或 者 接收 网 络 层 数据 之 前 ， 必 须 与 一 个 AP 相 
关联 。 尽 管 所 有 802. 11 标准 都 使 用 了 关联 ， 但 我 们 将 专门 在 IEEE 802. 11byg 环境 中 讨论 
这 一 主题 。 

当 网 络 管理 员 安 装 一 个 AP 时 ， 管 理 员 为 该 接 入 点 分 配 一 个 单字 或 双 字 的 服务 集 标识 
符 (Service Set Identifier，SSID)。( 例 如 ， 当 你 在 iPhone 上 选择 设置 WiFi 时 ， 将 显示 某 范 
围 内 每 个 AP 的 SSID.) 管理 员 还 必须 为 该 AP 分 配 一 个 信道 号 。 为 了 理解 信道 号 ， 回 想 前 
面 讲 过 的 802. 11 运行 在 2.4 ~2.4835GHz 的 频段 中 。 在 这 个 85MHz 的 频段 内 ，802. 11 定 
义 了 11 个 部 分 重 春 的 信道 。 当 且 仅 当 两 个 信道 由 4 个 或 更 多 信道 隔 开 时 它们 才 无 重 和 至 。 
特别 是 信道 1、6 和 11 的 集合 是 唯一 的 3 个 非 重 笃信 和 道 的 集合 。 这 意味 着 管理 员 可 以 在 同 
一 个 物理 网 络 中 安装 3 个 802. 11b AP， 为 这 些 AP 分 配 信道 1、6 和 11， 然 后 将 每 个 AP 都 
连接 到 一 台 交 换 机 上 。 

既然 已 经 对 802. 11 信道 有 了 基本 了 解 ， 我 们 则 可 以 描述 一 个 有 趣 ( 且 并 非 完 全 不 寻 
常 ) 的 情况 ， 即 有 关 WiFi 从 林 。WiFi 丛林 (WiFi jungle) 是 一 个 任意 物理 位 置 ,在 这 里 
无 线 站 点 能 从 两 个 或 多 个 AP 中 收 到 很 强 的 信号 。 例 如 ， 在 纽约 城 的 许多 咖啡 馆 中 ， 无 线 
站 点 可 以 从 附近 许多 AP 中 选取 一 个 信号 。 其 中 一 个 AP 可 能 由 该 咖啡 馆 管理 ， 而 其 他 AP 
可 能 位 于 咖啡 馆 附近 的 住宅 区 内 。 这 些 AP 中 的 每 一 个 都 可 能 位 于 不 同 的 子 网 中 ， 并 被 独 
立 分 配 一 个 信道 。 

现在 假定 你 带 着 自己 的 手机 、 平 板 电脑 或 便携 机 进入 这 样 一 个 WiFi 丛林 ， 寻 求 无 线 
因特网 接 人 和 一 个 蓝莓 松 饼 。 设 在 这 个 丛林 中 有 5 个 AP。 为 了 获得 因特网 接 人 ， 你 的 无 
线 站 点 需要 加 入 其 中 一 个 子 网 并 因此 需要 与 其 中 的 一 个 AP 相关 联 (associate) 。 关 联 意味 
着 这 一 无 线 站 点 在 自身 和 该 AP 之 间 创 建 一 个 虚拟 线路 。 特 别 是 ， 仅 有 关联 的 AP 才 向 你 
的 无 线 站 点 发 送 数据 帧 ， 并 且 你 的 无 线 站 点 也 仅仅 通过 该 关联 AP 向 因特网 发 送 数据 帧 。 
然而 ， 你 的 无 线 站 点 是 如 何 与 某 个 特定 的 AP 相关 联 的 ? 更 为 根本 的 问题 是 ， 你 的 无 线 站 
点 是 如 何 知 道 哪 个 AP 位 于 该 丛林 呢 ? 

802. 11 标准 要 求 每 个 AP 周期 性 地 发 送信 标 帧 (beacon frame) ， 每 个 信 标 帧 包括 该 AP 
的 SSID 和 MAC 地 址 。 你 的 无 线 站 点 为 了 得 知 正在 发 送信 标 帧 的 AP， 扫 描 11 个 信道 ， 找 
出 来 自 可 能 位 于 该 区 域 的 AP 所 发 出 的 信 标 帧 〈 其 中 一 些 AP 可 能 在 相同 的 信道 中 传输 ， 
即 这 里 有 一 个 丛林 !) 。 通 过 信 标 帧 了 解 到 可 用 AP 后 ,你 (或 者 你 的 无 线 主 机 ) 选择 一 个 
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AP 用 于 关联 。 

802. 11 标准 没有 指定 选择 哪个 可 用 的 AP 进行 关联 的 算法 ; 该 算法 被 遗留 给 802. 11 
固件 和 无 线 主 机 的 软件 设计 者 。 通 常 ， 主 机 选择 接收 到 的 具有 最 高 信号 强度 的 信 标 帧 。 虽 
然 高 信号 强度 好 (例如 可 参见 图 7-3) ， 信 和 号 强度 将 不 是 唯一 决定 主机 接收 性 能 的 AP 特 
性 。 特 别 是 ， 所 选择 的 AP 可 能 具有 强 信 号 ， 但 可 能 被 其 他 附属 的 主机 (将 需要 共享 该 AP 
的 无 线 带 宽 ) 所 过 载 ， 而 某 未 过 载 的 AP 由 于 稍 弱 的 信和 号 而 未 被 选择 。 选 择 AP 的 一 些 可 
替代 的 方法 近来 已 被 提出 [Vasudevan 2005; Nicholson 2006; Sudaresan 2006 ] 。 有 关 信 号 
强度 如 何 测量 的 有 趣 而 朴实 的 讨论 参见 [Bardwell 2004 ] 。 

扫描 信道 和 监听 信 标 帧 的 过 程 被 称 为 被 动 扫描 (passive scanning) (参见 图 7-9a)。 无 
线 主 机 也 能 够 执行 主动 扫描 (active scanning) ， 这 是 通过 向 位 于 无 线 主机 范围 内 的 所 有 AP 
广播 探测 帧 完成 的 ， 如 图 7-9b 所 示 。AP 用 一 个 探测 响应 帧 应 答 探 测 请 求 帧 。 无 线 主 机 则 
能 够 在 响应 的 AP 中 选择 某 AP 与 之 相关 联 。 









a) 被 动 扫描 O b 主动 扫描 


中 自 AP 发 送信 标 帧 Q@ 自 HI 广播 探测 请 求 帧 
@H1 向 选择 的 AP 发 送 关 联 请 求 帧 @ 自 AP 发 送 探 测 响应 
@) 选 择 的 AP 向 Hl1 发 送 关 联 响应 帧 (9H1 项 选择 的 AP 发 送 关联 请 求 帧 


@ 选 择 的 AP 向 H1 发 送 关 联 的 响应 由 
图 7-9 对接 入 点 的 主动 和 被 动 扫描 


选 定 与 之 关联 的 AP 后 ， 无 线 主机 向 AP 发 送 一 个 关联 请 求 帧 ， 并 且 该 AP 以 一 个 关联 
响应 帧 进行 响应 。 注 意 到 对 于 主动 扫描 需要 这 种 第 二 次 请 求 / 响 应 握手 ， 因 为 一 个 对 初始 
探测 请 求 帧 进行 响应 的 AP 并 不 知道 主机 选择 哪个 〈 可 能 多 个 ) 响应 的 AP 进行 关联 ， 这 
与 DHCP 客户 能 够 从 多 个 DHCP 服务 器 进行 选择 有 诸多 相同 之 处 (参见 图 4-24)。 一 旦 与 
一 个 AP 关联 ， 该 主机 希望 加 入 该 AP 所 属 的 子 网 中 (以 4.3.3 节 中 的 IP 寻 址 的 意义 )。 
因此 。 该 主机 通常 将 通过 关联 的 AP 向 该 子 网 发 送 一 个 DHCP 发 现 报 文 (参见 图 4-24)， 
以 获取 在 该 AP 子 网 中 的 一 个 也 地 址 。 一 旦 获得 地 址 ， 网 络 的 其 他 部 分 将 直接 视 你 的 主机 
为 该 子 网 中 的 另 一 台 主 机 。 

为 了 与 特定 的 AP 创建 一 个 关联 ， 某 无 线 站 点 可 能 要 向 该 AP 鉴别 它 自身 。802. 11 
无 线 LAN 提供 了 几 种 不 同 的 鉴别 和 接 人 方法 。 一 种 被 许多 公司 采用 的 方法 是 ， 基 于 一 
个 站 点 的 MAC 地 址 允许 其 接 人 一 个 无 线 网 络 。 第 二 种 被 许多 因特网 咖啡 屋 采 用 的 方法 
是 ， 应 用 用 户 名 和 口令 。 在 两 种 情况 下 ，AP 通常 与 一 个 鉴别 服务 器 进行 通信 ， 使 用 一 
种 诸如 RADIUS[ RFC 2865] 或 DIAMETER[ RFC 3588] 的 协议 ， 在 无 线 终端 站 和 鉴别 
服务 器 之 间 中 继 信息 。 分 离 鉴别 服务 器 和 AP， 使 得 一 个 鉴别 服务 器 可 以 服务 于 多 个 
AP， 将 〈 经 常 是 敏感 的 ) 鉴别 和 接 入 的 决定 集中 到 单一 服务 器 中 ,使 AP 费用 和 复杂 性 
较 低 。 我 们 将 在 第 8 章 看 到 ， 定 义 802. 11 协议 族 安全 性 的 新 IEEE 802. 11i 协议 就 恰好 
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采用 了 这 一 方法 。 
7.3.2 802. 11 MAC 协议 


一 且 某 无 线 站 点 与 一 个 AP 相关 联 ， 它 就 可 以 经 该 接 和 人 点 开始 发 送 和 接收 数据 帧 。 
然而 因为 许多 无 线 设备 或 AP 自身 可 能 希望 同时 经 过 相同 信道 传输 数据 帧 ， 因 此 需要 一 
个 多 路 访问 协议 来 协调 传输 。 下 面 ， 我 们 将 无 线 设 备 或 AP 称 为 站 点 (station), CH 
享 多 个 接 人 信道 。 正 如 在 第 6 章 和 7. 2. 1 节 中 讨论 的 那样 ， 宽 泛 地 讲 有 三 类 多 路 访问 协 
议 : 信道 划分 (包括 CDMA), 、 随 机 访问 和 轮流 。 受 以 太 网 及 其 随机 访问 协议 巨大 成 功 
的 激励 ，802. 11 的 设计 者 为 802. 11 无 线 LAN 选择 了 一 种 随机 访问 协议 。 这 个 随机 访问 
PURE E Bie iE SA CSMA (CSMA with collision avoidance) ,或 简称 为 CSMA/CA, 
与 以 太 网 的 CSMA/CD 相似 ，CSMA/CA 中 的 “CSMA” 人 代表“ 载波 侦 听 多 路 访问 ”， 意 
味 着 每 个 站 点 在 传输 之 前 侦 听 信道 ， 并 且 一 旦 侦 听 到 该 信道 忙 则 抑制 传输 。 尽 管 以 太 网 
和 802. 11 都 使 用 载波 侦 听 随机 接 人 ， 但 这 两 种 MAC 协议 有 重要 的 区 别 。 首 先 ，802. 11 
使 用 碰撞 避免 而 非 碰 撞 检 测 。 其 次 ， 由 于 无 线 信道 相对 较 高 的 误 比 特 率 ，802. 11 (RE 
于 以 太 网 ) 使 用 链 路 层 确认 / 重 传 (ARQ) 方案 。 我 们 将 在 下 面 讨论 802. 11 的 碰撞 避 
免 和 链 路 层 确认 机 制 。 
在 6.3.2 节 和 6.4.2 节 曾 讲 过 ， 使 用 以 太 网 的 碰撞 检测 算法 ， 以 太 网 节点 在 发 送 过 程 
中 监听 信道 。 在 发 送 过 程 中 如 果 检 测 到 另 一 节点 也 在 发 送 ， 则 放弃 自己 的 发 送 ， 并 且 在 等 
待 一 个 小 的 随机 时 间 后 再 次 发 送 。 与 802. 3 以 太 网 协议 不 同 ，802. 11MAC 协议 并 未 实现 碰 
撞 检 测 。 这 主要 由 两 个 重要 的 原因 所 致 : 
。 检测 碰撞 的 能 力 要 求 站 点 具有 同时 发 送 ( 站 点 自己 的 信号 ) 和 接收 (检测 其 他 站 
点 是 否 也 在 发 送 ) 的 能 力 。 因 为 在 802. 11 适配器 上 ， 接 收 信号 的 强度 通常 远 远 小 
于 发 送信 号 的 强度 ， 制 造 具有 检测 碰撞 能 力 的 硬件 代价 较 大 。 

e 更 重要 的 是 ， 即 使 适配器 可 以 同时 发 送 和 监听 信和 号 (并且 假设 它 一 旦 侦 听 到 信道 
忙 就 放弃 发 送 ) ， 适 配器 也 会 由 于 隐藏 终端 问题 和 衰减 问题 而 无 法 检测 到 所 有 的 碰 
撞 ， 参 见 7.2 节 的 讨论 。 

由 于 802. 11 无 线 局 域 网 不 使 用 碰撞 检测 ， 一 且 站 点 开始 发 送 一 个 帧 ， 它 就 完全 地 发 
送 该 帧 ; 也 就 是 说 ,一 旦 站 点 开始 发 送 ， 就 不 会 返回 。 正 如 人 们 可 能 猜想 的 那样 ， 磁 撞 存 
在 时 仍 发 送 整 个 数据 帧 (尤其 是 长 数据 帧 ) 将 严重 降低 多 路 访问 协议 的 性 能 。 为 了 降低 碰 
撞 的 可 能 性 ，802. 11 采用 几 种 碰撞 避免 技术 ， 我们 稍 后 讨论 它们 。 

然而 ， 在 考虑 碰撞 避免 之 前 ， 我 们 首先 需要 分 析 802.11 的 链 路 层 确 认 (link- layer 
acknowledgment) 方案 。7. 2 节 讲 过 ， 当 无 线 LAN 中 某 站 点 发 送 一 个 帧 时 ， 该 帧 会 由 于 多 
种 原因 不 能 无 损 地 到 达 目 的 站 点 。 为 了 处 理 这 种 不 可 忽视 的 故障 情况 ，802. 11 MAC 使 用 
链 路 层 确认 。 如 图 7-10 所 示 ， 目 的 站 点 收 到 一 个 通过 CRC 校 验 的 帧 后 ， 它 等 待 一 个 被 称 
作 短 帧 间 间 隔 (Short Inter- Frame Spacing, SIFS) 的 一 小 段 时 间 ， 然 后 发 回 一 个 确认 帧 。 
如 果 发 送 站 点 在 给 定 的 时 间 内 未 收 到 确认 帧 ， 它 假定 出 现 了 错误 并 重 传 该 帧 ， 使 用 CS- 
MA/CA 协议 访问 该 信道 。 如 果 在 若干 固定 次 重 传 后 仍 未 收 到 确认 ， 发 送 站 点 将 放弃 发 送 
并 丢弃 该 帧 。 

讨论 过 802. 11 如 何 使 用 链 路 层 确认 后 ,我 们 可 以 描述 802.11 的 CSMA/CA 协议 了 。 
假设 一 个 站 点 (无 线 站 点 或 者 AP) 有 一 个 帧 要 发 送 。 

1) 如 果 某 站 点 最 初 监听 到 信道 空闲 ， 它 将 在 一 个 被 称 作 分 布 式 帧 间 间 隔 (Distributed 
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Inter-Frame Space, DIFS) 的 短 时 间 段 后 发 送 该 帧 ， 如 图 7-10 所 示 。 
2) 和 否则， 该 站 点 选取 一 个 随机 回 退 值 (如 我 

们 在 6. 3. 2 节 中 遇 到 的 那样 ) 并 且 在 侦 听 信道 空间 CD 

时 递减 该 值 。 当 侦 听 到 信道 忙 时 ， 计 数值 保持 a 


ANE 
Drms| : 


目的 地 


E 





3) 当 计 数值 减 为 0 时 (注意 到 这 只 可 能 发 生 
在 信道 被 侦 听 为 空闲 时 ) ， 该 站 点 发 送 整个 数据 帧 
并 等 待 确认 。 

4) 如 果 收 到 确认 ， 发 送 站 点 知道 它 的 帧 已 被 
目的 站 正确 接收 了 。 如 果 该 站 点 要 发 送 另 一 帧 ， 它 
将 从 第 二 步 开 始 CSMA/CA 协议 。 如 果 未 收 到 确 
认 ， 发 送 站 点 将 重新 进入 第 二 步 中 的 回 退 阶段 ， 并 
从 一 个 更 大 的 范围 内 选取 随机 值 。 

前 面 讲 过 ， 在 以 太 网 的 CSMA/CD 的 多 路 访问 
协议 (6.3.2 节 ) 下 ,一 旦 侦 听 到 信道 空闲 ， 站 点 
开始 发 送 。 然 而 ， 使 用 CSMA/CA， 该 站 点 在 倒 计 
数 时 抑制 传输 ， 即 使 它 侦 听 到 该 信道 空闲 也 是 如 
此 。 为 什么 CSMA/CD 和 CSMA/CA 采用 了 不 同 的 并 
方法 呢 ? $ 

为 了 回答 这 一 问题 ， 我 们 首先 考虑 这 样 一 种 情 
形 ， 两 个 站 点 分 别 有 一 个 数据 帧 要 发 送 ， 但 是 , 由 ETO 802 11 使 用 链 路 层 确认 
于 侦 听 到 第 三 个 站 点 已 经 在 传输 ， 双 方 都 未 立即 发 送 。 使 用 以 太 网 的 CSMA/CD 协议 中 ， 
两 个 站 点 将 会 在 检测 到 第 三 方 发 送 完毕 后 立即 开始 发 送 。 这 将 导致 一 个 碰撞 ， 在 CSMA/ 
CD 协议 中 碰撞 并 非 是 一 个 严重 的 问题 ， 因 为 两 个 站 点 检测 到 碰撞 后 都 会 放弃 它们 的 发 送 ， 
从 而 避免 了 由 于 碰撞 而 造成 的 该 帧 剩余 部 分 的 无 用 发 送 。 而 在 802. 11 中 情况 却 十 分 不 同 ， 
因为 802. 11 并 不 检测 碰撞 和 放弃 发 送 ， 遭 受 碰撞 的 帧 仍 将 被 完全 传输 。 因 此 802. 11 的 目 
标 是 无 论 如 何 尽 可 能 避免 碰撞 。 在 802. 11 中 ， 如 果 两 个 站 点 侦 听 到 信道 忙 ， 它 们 都 将 立 
即 进入 随机 回 退 ， 希 望 选择 一 个 不 同 的 回 退 值 。 如 果 这 些 值 的 确 不 同 ， 一 旦 信道 空闲 ， 其 
中 的 一 个 站 点 将 在 另 一 个 之 前 发 送 ， 并 且 (如 果 两 个 站 点 均 未 对 对 方 隐藏 ) “失败 站 点 ” 
将 会 听 到 “胜利 站 点 ”的 信号 ,冻结 它 的 计数 器 ， 并 在 胜利 站 点 完成 传输 之 前 一 直 抑制 传 
输 。 通 过 这 种 方式 ， 避 免 了 高 代价 的 碰撞 。 当 然 ， 在 以 下 情况 下 使 用 802. 11 仍 可 能 出 现 
碰撞 : 两 个 站 点 可 能 互相 是 隐藏 的 ， 或 者 疝 者 可 能 选择 了 非常 佛 近 的 随机 回 授信 使 来 自 
先 开始 站 点 的 传输 也 必须 到 达 第 二 个 站 点 。 回 想 
前 面 我 们 在 图 6-12 的 环境 中 讨论 随机 访问 算法 时 
遇 到 过 这 个 问题 。 

1. 处理 隐藏 终端 ， RTS 和 CTS 


802. 11 MAC 协议 也 包括 了 一 个 极 好 (但 为 可 
选项 ) 的 预约 方案 ， 以 帮助 在 出 现 隐藏 终端 的 情 
况 下 避免 碰撞 。 我 们 在 图 7-11 的 环境 下 研究 这 种 








E 图 7-11 隐藏 余 端 的 例子 :HI 和 H2 
方案 ， 其 中 显示 了 两 个 无 线 站 点 和 一 个 接 人 点 。 彼此 互相 隐藏 
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这 两 个 无 线 站 点 都 在 该 AP 的 覆盖 范围 内 〈 其 覆盖 范围 显示 为 阴影 圆 环 ) ， 并 且 两 者 都 与 
该 AP 相关 联 。 然 而 ， 由 于 衰减 ， 无 线 节 点 的 信号 范围 局 限 在 图 7-11 所 示 的 阴影 圆 环 内 
部 。 因 此 ， 尽 管 每 个 无 线 站 点 对 AP 都 不 隐藏 ， 两 者 彼此 却 是 隐藏 的 。 

现在 我 们 考虑 为 什么 隐藏 终端 会 导致 出 现 问题 。 假 设 站 点 Hl 正在 传输 一 个 帧 ， 并 且 
在 Hl 传输 的 中 途 ， 站 点 H2 要 向 AP 发 送 一 个 帧 。 由 于 H2 未 听 到 来 自 HI 的 传输 ， 它 将 
首先 等 待 一 个 DIFS 间隔 ， 然 后 发 送 该 帧 ， 导 致 产生 了 一 个 碰撞 。 从 而 在 Hl 和 H2 的 整个 
发 送 阶 段 ， 信 道 都 被 浪费 了 。 


为 了 避免 这 一 问题 ，IEEE 802.11 协 源 所 有 其 他 节点 
议 允 许 站 点 使 用 一 个 短 请 求 发 送 (Request “2 Ej 
to Send, RTS) 控制 帧 和 一 个 短 允许 发 送 a < a 4 


(Clear to Send, CTS) 控制 帧 来 预约 对 信 Dirs{! 
道 的 访问 。 当 发 送 方 要 发 送 一 个 DATA Wi 
时 ， 它 能 够 首先 向 AP 发 送 一 个 RTS 帧 ， 
指示 传输 DATA 帧 和 确认 (ACK) 帧 需要 
的 总 时 间 。 当 AP 收 到 RTS 帧 后 ， 它 广播 
一 个 CTS 帧 作为 响应 。 该 CTS 帧 有 两 个 目 
的 : 给 发 送 方 明确 的 发 送 许 可 ， 也 指示 其 
他 站 点 在 预约 期 内 不 要 发 送 。 

因此 ， 在 图 7-12 中 ， 在 传输 DATA Wi 
Al, Hl 首先 广播 一 个 RTS 帧 ， 该 帧 能 被 
其 范围 内 包括 AP 在 内 的 所 有 站 点 听 到 。 
AP 然后 用 一 个 CTS 帧 响应 ,该 帧 也 被 其 
范围 内 包括 Hl 和 H2 在 内 的 所 有 站 点 听 
到 。 站 点 H2 听 到 CTS 后 ,在 CTS 帧 中 指 
明 的 时 间 内 将 抑制 发 送 。RTS、CTS、 | : : 
DATA 和 ACK 帧 如 图 7-12 所 示 。 > 3 s 





RTS 和 CTS 帧 的 使 用 能 够 在 两 个 重要 图 7-12 ”使 用 RTS 和 CTS 帧 的 碰撞 避免 
方面 提高 性 能 : 


。 隐藏 终端 问题 被 缓解 了 ， 因 为 长 DATA 帧 只 有 在 信道 预约 后 才 被 传输 。 
e 因为 RTS 和 CTS 帧 较 短 ， 涉 及 RTS 和 CTS 帧 的 碰撞 将 仅 持 续 短 RTS 和 CTS 帧 的 
持续 期 。 一 旦 RTS 和 CTS 帧 被 正确 传输 ， 后 续 的 DATA 和 ACK 帧 应 当 能 无 碰撞 地 
发 送 。 
建议 读者 去 查看 本 书 配套 网 站 上 的 802.11 Java 程序 。 这 个 交互 式 程序 演示 了 
CSMA/CA 协议 ， 包 括 RTS/CTS 交换 序列 。 
尽管 RTS/CTS 交换 有 助 于 降低 碰撞 ， 但 它 同样 引入 了 时 延 以 及 消耗 了 信道 资源 。 因 
IE, RTS/CTS 交换 仅仅 用 于 为 长 数据 帧 预约 信道 。 在 实际 中 ， 每 个 无 线 站 点 可 以 设置 一 个 
RTS 门限 值 ， 仅 当 帧 长 超过 门限 值 时 ， 才 使 用 RTS/CTS 序列 。 对 许多 无 线 站 点 而 言 ， 默 
认 的 RTS 门限 值 大 于 最 大 帧 长 值 ， 因 此 对 所 有 发 送 的 DATA Wi, RTS/CTS 序列 都 被 跳 过 。 


2. 使 用 802. 11 作为 一 个 点 对 点 链 路 
到 目前 为 止 我 们 的 讨论 关注 在 多 路 访问 环境 中 使 用 802. 11。 应 该 指出 ， 如 果 两 个 节点 
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每 个 都 具有 一 个 定向 天 线 ， 它 们 可 以 将 其 定向 天 线 指向 对 方 ， 并 基本 上 是 在 一 个 点 对 点 的 
链 路 上 运行 802. 11 协议 。 如 果 商 用 802. 11 硬件 产品 价格 低廉 ， 那 么 使 用 定向 天 线 以 及 增 
加 传输 功率 使 得 802. 11 成 为 一 个 在 数 十 公里 距离 中 提供 无 线 点 对 点 连接 的 廉价 手段 。 
[Raman 2007] 描述 了 这 样 一 个 运行 于 印度 恒 河 郊区 平原 上 的 多 跳 无 线 网 络 ， 其 中 包含 了 
点 对 点 802. 11 链 路 。 


7.3.3 IEEE 802. 11 帧 


尽管 802. 11 帧 与 以 太 网 帆 有 许多 共同 特点 ， 但 它 也 包括 了 许多 特定 用 于 无 线 链 路 的 
字段 。8021. 11 帧 如 图 7-13 所 示 ， 在 该 帧 上 的 每 个 字段 上 面 的 数字 代表 该 字段 以 字 节 计 的 
KE; 在 该 帧 控制 字段 中 ， 每 个 子 字段 上 面 的 数字 代表 该 子 字段 以 比特 计 的 长 度 。 现 在 我 
们 查看 该 帧 中 各 字段 以 及 帧 控制 字段 中 一 些 重要 的 子 字 段 。 

帧 (数字 代表 该 字段 的 字 节 长 度 ) 
2 2 De Se M 和 0-2312 = 
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1. 有 效 载荷 与 CRC 字段 

帧 的 核心 是 有 效 载 答 ， 它 通常 是 由 一 个 全 数据 报 或 者 ARP 分 组 组 成 。 尽 管 这 一 字段 
允许 的 最 大 长 度 为 2312 字 节 ， 但 它 通常 小 于 1500 字 节 ， 放 置 一 个 人 数据 报 或 一 个 ARP 
分 组 。 如 同 以 太 网 帧 一 样 ，802. 11 帧 包括 一 个 循环 元 余 校 验 (CRC)， 从 而 接收 方 可 以 检 
测 所 收 到 帧 中 的 比特 错误 。 如 我 们 所 看 到 的 那样 ， 比 特 错 误 在 无 线 局 域 网 中 比 在 有 线 局 域 
网 中 更 加 普遍 ， 因 此 CRC 在 这 里 更 加 有 用 。 

2. 地 址 字段 


也 许 802. 11 帧 中 最 引 人 注 意 的 不 同 之 处 是 它 具 有 4 个 地 址 字段 ， 其 中 每 个 都 可 以 包 
含 一 个 6 字 节 的 MAC 地 址 。 但 为 什么 要 4 个 地 址 字段 呢 ? 如 以 太 网 中 那样 ， 一 个 源 MAC 
地 址 字段 和 一 个 目的 MAC 地 址 字段 不 就 足够 了 ? 事实 表明 ， 出 于 互联 目的 需要 3 个 地 址 
字段 ， 特 别 是 将 网 络 层 数据 报 从 一 个 无 线 站 点 通过 一 个 AP 送 到 一 台 路 由 器 接口 。 当 AP 
在 自 组 织 模式 中 互相 转发 时 使 用 第 四 个 地 址 。 由 于 我 们 这 里 仅仅 考虑 基础 设施 网 络 ， 所 以 
只 关注 前 3 个 地 址 字段 。802. 11 标准 定义 这 些 字段 如 下 : 
e 地 址 2 是 传输 该 帧 的 站 点 的 MAC 地 址 。 因 此 ， 如 果 一 个 无 线 站 点 传输 该 帧 ， 该 站 
点 的 MAC 地 址 就 被 插入 在 地 址 2 字段 中 。 类 似 地 ， 如 果 一 个 AP 传输 该 帧 ， 该 AP 
的 MAC 地 址 也 被 插入 在 地 址 2 字段 中 。 
。 地 址 1 是 要 接收 该 帧 的 无 线 站 点 的 MAC 地 址 。 因 此 ， 如 果 一 个 移动 无 线 站 点 传输 
该 帧 ， 地 址 1 包含 了 该 目的 AP 的 MAC 地 址 。 类 似 地 ， 如 果 一 个 AP 传输 该 帧 ， 
地 址 1 包含 该 目的 无 线 站 点 的 MAC 地 址 。 
。 为 了 理解 地 址 3， 回 想 BSS (由 AP 和 无 线 站 点 组 成 ) 是 一 个 子 网 的 一 部 分 ， 并 且 这 个 
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子 网 经 一 些 路 由 器 接口 与 其 他 子 网 相连 。 地 址 3 包含 这 个 路 由 器 接口 的 MAC 地 址 。 
为 了 对 地 址 3 的 目的 有 更 深入 的 理解 ， 
我 们 观察 在 图 7-14 环境 中 的 网 络 互联 的 例 
子 。 在 这 幅 图 中 ， 有 两 个 AP， 每 个 AP fH 
责 一 些 无 线 站 点 。 每 个 AP 到 路 由 器 有 一 
个 直接 连接 ， 路 由 器 依次 又 连接 到 全 球 因 
特 网 。 我 们 应 当 记 住 AP 是 链 路 层 设备 ， 
它 既 不 能 “说 ”了 P 又 不 理解 PP 地 址 。 现 
在 考虑 将 一 个 数据 报 从 路 由 器 接口 RI 移 
到 无 线 站 点 HI 。 路 由 器 并 不 清楚 在 它 和 
HI 之 间 有 一 个 AP; 从 路 由 器 的 观点 来 说 ， 
H1 仅仅 是 路 由 器 所 连接 的 子 网 中 的 一 台 
主机 。 图 7-14 在 802.11 帧 中 使 用 地 址 字段 : 
e 路 由 器 知道 Hl 的 下 地 址 〔( 从 数 在 Hl 和 RI 之 间 发 送 帧 
据 报 的 目的 地 址 中 得 到 ) ， 它 使 用 ARP 来 确定 Hl 的 MAC 地 址 ， 这 与 在 普通 的 以 
太 网 LAN 中 相同 。 获 取 HI 的 MAC 地 址 后 ， 路 由 器 接口 RI 将 该 数据 报 封 装 在 一 
个 以 太 网 帧 中 。 该 帧 的 源 地 址 字段 包含 了 R1 MAC 地 址 ， 目 的 地 址 字段 包含 HI 
的 MAC 地址 。 

© 当 该 以 太 网 由 到 达 AP 后 ， 该 AP 在 将 其 传输 到 无 线 信 道 前 ， 先 将 该 802. 3 以 太 网 
帧 转换 为 一 个 802. 11 帧 。 如 前 所 述 ，AP 将 地 址 1 和 地 址 2 分 别 填 上 HI 的 MAC 
地 址 和 其 自身 的 MAC 地 址 。 对 于 地 址 3，AP 插入 R1 的 MAC 地 址 。 通 过 这 种 方 
sk, Hl 可 以 确定 (从 地 址 3) 将 数据 报 发 送 到 子 网 中 的 路 由 器 接口 的 MAC 地 址 。 

现在 考虑 在 从 Hl 移动 一 个 数据 报到 Rl 的 过 程 中 无 线 站 点 Hl 进行 响应 时 发 生 的 情况 。 
e HI 生成 一 个 802. 11 帧 ， 如 上 所 述 ， 分 别 用 AP 的 MAC 地 址 和 H1 的 MAC 地 址 填 
充 地 址 1 和 地 址 2 字段 。 对 于 地 址 3，HIl 插入 Rl 的 MAC 地 址 。 

e 当 AP 接收 该 802. 11 帧 后 ,将 其 转换 为 以 太 网 帧 。 该 帧 的 源 地 址 字段 是 Hl 的 
MAC 地 址 ， 目 的 地 址 字段 是 Rl 的 MAC 地 址 。 因 此 ， 地 址 3 允许 AP 在 构建 以 太 
网 帧 时 能 够 确定 目的 MAC 地 址 。 

总 之 ， 地址 3 在 BSS 和 有 线 局 域 网 互联 中 起 着 关键 作用 。 

3. 序号 、 持 续 期 和 帧 控制 字段 

前 面 讲 过 在 802. 11 网 络 中 ， 无 论 何 时 一 个 站 点 正确 地 收 到 一 个 来 自 于 其 他 站 点 的 帧 ， 
它 就 回 发 一 个 确认 。 因 为 确认 可 能 会 丢失 ， 发 送 站 点 可 能 会 发 送 一 个 给 定 帧 的 多 个 副本 。 
正如 我 们 在 rd2. 1 协议 讨论 中 所 见 (3. 4. 1 节 )， 使 用 序号 可 以 使 接收 方 区 分 新 传输 的 帧 
和 以 前 帧 的 重 传 。 因 此 在 802. 11 帧 中 的 序号 字段 在 链 路 层 与 在 第 3 章 中 运输 层 中 的 该 字 
段 有 着 完全 相同 的 目的 。 

前 面 讲 过 802. 11 协议 允许 传输 节点 预约 信道 一 段 时 间 ， 包 括 传输 其 数据 帧 的 时 间 和 
传输 确认 的 时 间 。 这 个 持续 期 值 被 包括 在 该 帧 的 持续 期 字段 中 (在 数据 帧 和 RTS 及 CTS 
帧 中 均 存 在 ) 。 

如 图 7-13 所 示 ， 帧 控制 字段 包括 许多 子 字段 ， 我 们 将 提 一 下 其 中 比较 重要 的 子 字段 ， 
更 加 完整 的 讨论 请 参见 802. 11 规范 [ Held 2001; Crow 1997; IEEE 802. 11 1999] 。 类 型 和 
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子 类 型 字段 用 于 区 分 关联 、RTS、CTS、ACK 和 数据 帧 。To (到 ) 和 From (M) 字段 用 于 
定义 不 同 地 址 字段 的 含义 。( 这 些 含义 随 着 使 用 自 组 织 模式 或 者 基础 设施 模式 而 改变 ， 而 
且 在 使 用 基础 设施 模式 时 ， 也 随 着 是 无 线 站 点 还 是 AP 在 发 送 帧 而 变化 。) 最 后 ，WEP F 
段 指示 了 是 否 使 用 加 密 (WEP 将 在 第 8 章 中 讨论 。) 


7. 3.4 在 相同 的 IP 子 网 中 的 移动 性 


为 了 增加 无 线 LAN 的 物理 范围 ， 公 司 或 大 学 经 常会 在 同一 个 中 子 网 中 部 署 多 个 BSS。 
这 自然 就 引出 了 在 多 个 BSS 之 间 的 移动 性 问题 ， 即 无 线 站 点 如 何在 维持 进行 中 的 TCP 会 话 
的 情况 下 ， 无 颖 地 从 一 个 BSS 移动 到 另 一 个 BSS? 正如 我 们 将 在 本 小 节 中 所 见 ， 当 这 些 
BSS 属于 同一 子 网 时 ， 移 动 性 可 以 用 一 种 相对 直接 的 方式 解决 。 当 站 点 在 不 同 子 网 间 移 动 
时 ， 就 需要 更 为 复杂 的 移动 性 管理 协议 了 ， 我 们 将 在 7.5 节 和 7.6 节 中 学 习 这 些 协议 。 

我 们 现在 看 一 个 同一 子 网 中 的 不 同 BSS 之 间 的 移动 性 的 特定 例子 。 图 7-15 aR TA 
有 一 台 主 机 Hl 的 两 个 互联 的 BSS， 该 主机 从 BSS1 移动 到 BSS2。 因 为 在 这 个 例子 中 连接 
两 个 BSS 的 互联 设备 不 是 一 台 路 由 器 ， 故 在 两 个 交换 机 
BSS 中 的 所 有 站 点 (包括 AP) 都 属于 同一 个 IP Eaa 
子 网 。 因 此 ， 当 Hl 从 BSS] 移动 到 BSS2 时 ， 它 
可 以 保持 自己 的 卫 地 址 和 所 有 正在 进行 的 TCP 
连接 。 如 果 互 联 设备 是 一 台 路 由 器 ， 则 Hl 必须 
在 它 移 动 进入 的 子 网 中 获得 一 个 新 地 址 。 这 种 地 
址 的 变化 将 打 断 (并且 最 终 终 止 ) 在 Hl 的 任何 
进行 中 的 TCP 连接 。 在 7.6 节 中 ， 我们 将 能 看 到 
一 种 网 络 层 移 动 性 协议 如 移动 卫 能 被 用 于 避免 
该 问题 。 图 7-15 同一 子 网 中 的 移动 性 
l 但 是 Hl 从 BSS1 移动 到 BSS2 时 具体 会 发 生 哪些 事 呢 ? 随 着 Hl 逐步 远离 AP1，Hl 检 
WAKA API 的 信号 逐渐 减弱 并 开始 扫描 一 个 更 强 的 信号 。H1 收 到 来 自 AP2 的 信 标 帧 
(在 许多 公司 和 大 学 的 设置 中 它 与 AP1 有 相同 的 SSID), H1 然后 与 AP1 解除 关联 ， 并 与 
AP2 关联 起 来 ， 同 时 保持 其 IP 地 址 和 维持 正在 进行 的 TCP 会 话 。 

从 主机 和 AP 的 角度 ， 这 就 处 理 了 切换 问题 。 但 对 图 7-15 中 的 交换 机 又 会 发 生 什么 样 
的 情况 呢 ? 交换 机 如 何 知道 主机 已 经 从 一 个 AP 移动 到 另 一 个 AP We? 回想 第 6 章 所 述 ， 
交换 机 是 “自学 习 ” 的 ,并 且 自 动 构建 它们 的 转发 表 。 这 种 自学 习 的 特征 很 好 地 处 理 了 偶 
尔 的 移动 〈 例 如 ， 一 个 雇员 从 一 个 部 门 调转 到 另 一 个 部 门 ) 。 然 而 ， 交 换 机 没有 被 设计 用 
来 支持 用 户 在 不 同 BSS 间 高 度 移动 ， 同 时 又 希望 保持 TCP 连接 。 为 理解 这 一 问题 ， 回 想 在 
移动 之 前 ， 交 换 机 在 其 转发 表 中 有 一 个 表 项 ， 对 应 Hl 的 MAC 地 址 与 到 达 Hl 所 通过 的 出 
交换 机 端口 。 如 果 HI 初始 在 BSS1 中 ， 则 发 往 H 的 数据 报 将 经 AP1 导向 HI 。 然 而 ， 一 
H H1 与 BSS2 关联 ， 它 的 帧 应 当 被 导向 AP2。 一 种 解决 方法 (真有 点 不 规范 ) 是 在 新 的 
关联 形成 后 ， 让 AP2 以 Hl 的 源 地 址 向 交换 机 发 送 一 以 太 网 广播 帧 。 当 交换 机 收 到 该 帧 
后 ， 更 新 其 转发 表 ， 使 得 H1 可 以 通过 AP2 到 达 。802. 11f 标准 小 组 正在 开发 一 个 AP 间 的 
协议 来 处 理 这 些 以 及 相关 的 问题 。 

我 们 以 上 的 讨论 关注 了 在 相同 LAN 子 网 中 的 移动 性 。 前 面 我 们 在 6. 4. 4 节 学 习 过 VLAN, 
它 能 够 用 来 将 若干 LAN 孤岛 连接 成 为 一 个 大 虚拟 LAN， 该 虚拟 LAN 能 够 跨越 很 大 的 地 理 范 
围 。 在 这 种 VALN 中 的 基站 之 间 的 移动 性 能 够 以 上 述 完全 相同 的 方式 来 处 理 [Yu 2011], 
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7.3.5 802.11 中 的 高 级 特色 


我 们 将 简要 地 讨论 802. 11 网 络 中 具有 的 两 种 高 级 能 力 ， 以 此 来 完成 我 们 学 习 802. 11 
的 内 容 。 如 我 们 所 见 ， 这 些 能 力 并 不 是 完全 特定 于 802. 11 标准 的 ， 而 是 在 该 标准 中 可 能 
由 特定 机 制 产生 的 。 这 使 得 不 同 的 厂商 可 使 用 他 们 自己 (专用 ) 的 方法 来 实现 这 些 能 力 ， 
这 也 许 能 让 他 们 增强 竞争 能 力 。 

1. 802. 11 速率 适应 

我 们 在 前 面 图 7-3 中 看 到 ， 不 同 的 调制 技术 (提供 了 不 同 的 传输 速率 ) 适合 于 不 同 的 
SNR 情况 。 考 虑 这 样 一 个 例子 ,一 个 802. 11 用 户 最 初 离 基 站 20 米 远 ， 这 里 信 品 比 高 。 在 
此 高 信 噪 比 的 情况 下 ， 该 用 户 能 够 与 基站 使 用 可 提供 高 传输 速率 的 物理 层 调 制 技术 进行 通 
信 ， 同 时 维持 低 BER。 这 个 用 户 多 么 幸福 啊 ! 假定 该 用 户 开始 移动 ， 向 离开 基站 的 方向 走 
去 ， 随 着 与 基站 距离 的 增加 ，SNR 一 直 在 下 降 。 在 这 种 情况 下 ， 如 果 在 用 户 和 基站 之 间 运 
行 的 802. 11 协议 所 使 用 的 调制 技术 没有 改变 的 话 ， 随 着 SNR 减 小 ，BER 将 高 得 不 可 接 
Z, 最 终 ， 传 输 的 帧 将 不 能 正确 收 到 。 

由 于 这 个 原因 ， 某 些 802. 11 实现 具有 一 种 速率 自 适应 能 力 ， 该 能 力 自 适应 地 根据 当 
前 和 近期 信道 特点 来 选择 下 面 的 物理 层 调制 技术 。 如 果 一 个 节点 连续 发 送 两 个 帧 而 没有 收 
到 确认 〈 信 道上 一 个 比特 差错 的 隐 式 指示 ) ， 该 传输 速率 降低 到 前 一 个 较 低 的 速率 。 如 果 
10 个 帧 连续 得 到 确认 ， 或 如 果 用 来 跟踪 自 上 次 降 速 以 来 时 间 的 定时 器 超时 ， 该 传输 速率 
提高 到 上 一 个 较 高 的 速率 。 这 种 速率 适应 机 制 与 TCP 的 拥塞 控制 机 制 具有 相同 的 “探测 ” 
原理 ， 即 当 条 件 好 时 (反映 为 收 到 ACK) ， 增 加 传输 速率 ， 除 非 某 个 “坏事 ”发 生 了 
(ACK 没有 收 到 ) ; 当 某 个 “坏事 ”发 生 了 ， 减 小 传输 速率 。 因 此 ，802. 11 的 速率 适应 和 
TCP 的 拥塞 控制 类 似 于 年 幼 的 孩子 ， 他 们 不 断 地 向 父母 要 求 越 来 越 多 〈 如 幼儿 要 糖果 ， 青 
少年 要 求 推迟 睡觉 ) ， 直 到 父母 亲 最 后 说 “ 够 了 !”， 和 孩子 们 不 再 要 求 了 〈 仅 当 以 后 情况 已 
经 变 好 了 才 会 再 次 尝试 ) 。 已 经 提出 了 一 些 其 他 方案 以 改善 这 个 基本 的 自动 速率 调整 方案 
[ Kamerman 1997; Holland 2001; Lacage 2004 | 。 

2. 功率 管理 

功率 是 移动 设备 的 宝贵 资源 ， 因 此 802. 11 标准 提供 了 功率 管理 能 力 ， 以 使 802. 11 节 
点 的 侦 听 、 传 输 和 接收 功能 以 及 其 他 需要 “打开 ”电路 的 时 间 量 最 小 化 。802. 11 功率 管 
理 按 下 列 方式 运行 。 一 个 节点 能 够 明显 地 在 睡眠 和 唤醒 状态 之 间 交 蔡 ( 像 在 课堂 上 睡觉 的 
学 生 !) 。 通 过 将 802. 11 帧 首部 的 功率 管理 比特 设置 为 1， 某 节点 向 接 入 点 指示 它 将 打算 睡 
眠 。 设 置 节点 中 的 一 个 定时 器 ,使 得 正好 在 AP 计划 发 送 它 的 信 标 帧 前 唤醒 节点 (前 面 讲 
过 AP 通常 每 100ms 发 送 一 个 信 标 帧 ) 。 因 为 AP 从 设置 的 功率 传输 比特 知道 哪个 节点 打算 
睡眠 ， 所 以 该 AP 知道 它 不 应 当 向 这 个 节点 发 送 任何 帧 ， 先 缓存 目的 地 为 睡眠 主机 的 任何 
帧 ， 待 以 后 再 传输 。 

在 AP 发 送信 标 帧 前 ， 恰 好 唤醒 节点 ， 并 迅速 进入 全 面 活动 状态 〈 与 睡觉 的 学 生 不 
同 ， 这 种 唤醒 仅 需 要 250ks[ Kamerman 1997] ) 。 由 AP 发 送 的 信 标 帧 包含 了 帧 被 缓存 在 AP 
中 的 节点 的 列表 。 如 果 某 节点 没有 缓存 的 帧 ， 它 能 够 返回 睡眠 状态 。 和 否则 ， 该 节点 能 够 通 
过 向 AP 发 送 一 个 探 询 报 文明 确 地 请 求 发 送 缓存 的 帧 。 对 于 信 标 之 间 的 100ms 时 间 来 说 ， 
250hs 的 唤醒 时 间 以 及 类 似 的 接收 信 标 帧 及 检查 以 确保 不 存在 缓存 帧 的 短小 时 间 ， 没 有 帧 
要 发 送 和 接收 的 节点 能 够 睡眠 99% 的 时 间 ， 从 而 大 大 节省 了 能 源 。 
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7.3.6 个 人 域 网 络 : 蓝牙 和 ZigBee 


如 图 7-2 所 示 ，IEEE 802. 11 WiFi 标准 主要 针对 相距 多 达 100m 的 设备 间 的 通信 ( 当 
使 用 802. 11 具有 定向 天 线 的 点 对 点 配置 时 除外 ) 。 两 个 其 他 的 IEEE 802 无 线 协议 是 蓝牙 
和 ZigBee (定义 在 IEEE 802. 15. 1 和 IEEE 802. 15. 4 标准 中 [IEEE 802. 15 2012] ) 。 

1. 蓝牙 


IEEE 802. 15. 1 网 络 以 低 功 率 和 低 成 本 在 小 范围 内 运行 。 它 本 质 上 是 一 个 低 功 率 、 小 
范围 、 低 速率 的 “电缆 替代 ”技术 ， 用 于 计算 机 与 其 无 线 键 盘 、 鼠 标 或 其 他 外 部 设备 如 蜂 
窝 电话 、 扬 声 器 、 头 戴 式 耳机 及 其 他 设备 的 互联 ， 而 802.11 是 一 个 较 高 功率 、 中 等 范围 、 
较 高 速率 的 “ 接 人 ”技术 。 为 此 ，802. 15. 1 网 络 有 时 被 称 为 无 线 个 人 域 网 络 ( Wireless 
Personal Area Network, WPAN), 802. 15. 1 的 链 路 层 和 物理 层 基 于 早期 用 于 个 人 域 网 络 的 
蓝牙 (Bluetooth) 规范 [Held 2001, Bisdikian 2001 ] 802. 15. 1 网 络 以 TDM 方式 工作 于 
无 须 许可 证 的 2.4GHz 无 线 电波 段 ， 每 个 时 隙 长 度 为 625us。 在 每 个 时 隙 内 ， 发 送 方 利用 
79 个 信道 中 的 一 个 进行 传输 ， 同 时 从 时 隙 到 时 隙 以 一 个 已 知 的 伪 随 机 方式 变更 信道 。 这 
种 被 称 作 跳 频 扩 展 频 谱 (Frequency-Hopping Spread Spectrum, FHSS) 的 信道 跳动 的 形式 将 
传输 及 时 扩展 到 整个 频谱 。802. 15. 1 能 够 提供 高 达 4Mbps 的 数据 率 。 

802. 15. 1 网 络 是 自 组 织 网 络 : 不 需要 网 络 基础 设施 (如 一 个 接 信 点) 来 互 连 
802. 15. 1 设备 。 因 此 ，802. 15. 1 设备 必须 自己 进行 组 织 。802. 15. 1 设备 首先 组 织 成 一 个 
多 达 8 个 活动 设备 的 皮 可 网 (piconet) ， 如 图 7-16 所 示 。 这 些 设备 之 一 被 指定 为 主 设备 ， 
其 余 充当 从 设备 。 主 节点 真正 控制 皮 可 网 ， ESE EPAR 它 可 以 在 
每 个 奇数 时 隙 中 发 送 ， 而 从 设备 仅 当 主 设 
备 在 前 一 时 隙 与 其 通信 后 才 可 以 发 送 ， 并 
且 只 能 发 送 给 主 设备 。 除 了 从 设备 ， 网 络 
中 还 可 以 有 多 达 255 个 的 寄 放 (parked) 
设备 。 这 些 设备 仅 当 其 状态 被 主 节 点 从 寄 
放 转 换 为 活动 之 后 才 可 以 进行 通信 。 

希望 了 解 更 多 有 关 802. 15. 1WPAN 信 
息 的 读者 可 以 查阅 蓝牙 参考 资料 [Held 
2001, Bisdikian 2001 ] ， 或 者 IEEE 802. 15 
官方 Web 网 站 [IEEE 802. 15 2012], 

2. ZigBee 


IEEE 标准 化 的 第 二 个 个 人 域 网 络 是 
802. 14.5 [IEEE 802. 15 2012 ] ， 它 被 称 为 ZigBee。 虽 然 蓝 牙 网 络 提供 了 一 种 “电缆 替代 ” 
的 超过 每 秒 兆 比特 的 数据 率 ， 但 ZigBee 较 之 蓝牙 其 服务 目标 是 低 功 率 、 低 数据 率 、 低 工作 
周期 的 应 用 。 尽 管 我 们 可 能 倾向 于 认为 “更 大 和 更 快 就 更 好 ”， 但 是 并 非 所 有 的 网 络 应 用 
都 需要 高 带宽 和 随 之 而 来 的 高 成 本 (经 济 和 功率 成 本 ) 。 例 如 ， 家 庭 温 度 和 光线 传感器 、 
安全 设备 和 墙 上 安装 的 开关 都 是 非常 简单 、 低 功率 、 低 工作 周期 、 低 成 本 设备 。ZigBee Al 
此 是 非常 适合 于 这 些 设备 的 。ZigBee 定义 了 20kbps, 40kbps, 100kbps 和 250kbps 的 信道 
速率 ， 这 取决 于 信道 的 频率 。 

ZigBee 网 络 中 的 节点 具有 两 个 特色 。 多 个 所 谓 “ 简 化 功能 设备 ”在 单个 “全 功能 设 
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图 7-16 蓝牙 皮 可 网 
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备 ”控制 下 作为 从 设备 运行 ， 与 蓝牙 从 设备 非常 相似 。 一 个 全 功能 设备 能 够 作为 一 个 主 设 
备 运 行 ， 就 像 在 蓝牙 中 控制 多 个 从 设备 那样 ， 并 且 多 个 全 功能 设备 还 能 够 配置 为 一 个 网 状 
(mesh) 网 络 ， 其 中 全 功能 设备 在 它们 之 间 发 送 帧 。ZigBee 可 以 共享 许多 我 们 已 经 在 其 他 
链 路 层 协 议 中 遇 到 的 协议 机 制 : 信 标 帧 和 链 路 层 确认 〈 类 似 于 802. 11 ) ， 具 有 二 进 制 回 退 
的 载波 侦 听 随机 访问 协议 〈 类 似 于 802. 11 和 以 太 网 ) ， 以 及 时 隙 的 固定 、 确 保 的 分 配 (类 
似 于 DOCSIS) 。 

ZigBee 网 络 能 够 配置 为 许多 不 同 的 方式 。 我 们 考虑 一 种 简单 的 场合 ， 其 中 单一 的 全 功 
能 设备 使 用 信 标 帧 以 一 种 时 隙 方式 控制 多 个 简化 功能 设备 。 图 7-17 显示 了 这 种 情况 ， 其 
中 ZigBee 网 络 将 时 间 划 分 为 反复 出 现 的 超 帧 ， 每 个 超 帧 以 一 个 信 标 帧 开始 。 每 个 信 标 帧 将 
超 帧 划分 为 一 个 活跃 周期 (在 这 个 周期 内 设备 可 以 传输 ) 和 一 个 非 活路 周期 (在 这 个 周 
期 内 所 有 设备 包括 控制 器 能 够 睡眠 进而 保存 能 量 )。 活 路 周期 由 16 个 时 隙 组 成 ， 其 中 一 些 
由 采用 CSMA/CA 随机 接 人 方式 的 设备 使 用 ,- 其 中 一 些 由 控制 器 分 配给 特定 的 设备 ， 因 而 
为 那些 设备 提供 了 确保 的 信道 。 有 关 ZigBee 网 络 的 更 多 细节 能 够 在 [Baronti 2007, IEEE 
802. 15.4 2012] 中 找到 。 


[ 信 标 a 
es 


| k— zamm “一 站 确保 的 时 阶 | 
超 由 


图 7-17 ZigBee 802. 14. 4 超 帧 结构 


7.4 蜂窝 因特网 接 入 


在 前 一 节 中 ， 我 们 考察 了 一 台 因 特 网 主机 当 位 于 WiFi 热 区 中 时 ， 即 当 它 位 于 一 个 
802. 11 接 入 点 附近 时 ， 是 如 何 接 人 因特网 的 。 然 而 大 多 数 Wiki 热 区 只 有 一 个 直径 为 10 ~ 
100m 的 小 规模 覆盖 范围 。 当 我 们 十 分 需要 无 线 因 特 网 接 人 但 同时 又 无 法 访问 WiFi 热 区 
时 ， 该 怎么 办 呢 ? 

鉴于 蜂窝 电话 目前 在 全 球 许多 区 域 已 经 是 无 处 不 在 了 ， 一 个 很 自然 的 策略 就 是 扩展 蜂 
窝 网 络 ， 使 它们 不 仅 支 持 语音 电话 ， 同 时 也 支持 无 线 因特网 接 入 。 理 想 情 况 下 ， 这 种 因 特 
网 接 人 将 会 有 相当 高 的 速率 ， 并 且 可 以 提供 无 颖 的 移动 性 ， 允 许 用 户 在 旅行 过 程 中 (如 在 
汽车 或 火车 上 ) 保持 其 TCP 会 话 。 使 用 足够 高 的 上 行 和 下 行 比特 速率 ， 用 户 甚 至 可 以 在 
移动 中 维持 视频 会 议 。 这 种 情况 并 非 遥 不 可 及 。 随 着 那些 我 们 将 在 这 里 涉及 的 宽带 数据 服 
务 的 更 广泛 部 署 ， 每 秒 几 兆 比特 的 数据 速率 正 变 得 可 行 。 

在 本 节 中 ， 我 们 对 当前 和 即将 出 现 的 蜂窝 因特网 接 人 技术 进行 简要 概述 。 我 们 这 里 
仍然 重点 关注 无 线 第 一 跳 以 及 将 无 线 第 一 跳 连 接 进 更 大 的 电话 网 和 因特网 的 网 络 ; 在 
7.7 节 中 ,我们 将 考虑 如 何 把 呼叫 路 由 选择 到 在 不 同 基站 间 移 动 的 用 户 。 我 们 的 简要 讨 
论 只 是 对 蜂窝 技术 进行 一 个 简单 、 宏 观 描述 。 当 然 ， 现 代 蜂 帘 通 信 有 更 大 的 广度 和 深 
度 ， 有 许多 大 学 提供 关于 这 一 主题 的 许多 课程 。 希 望 对 此 做 更 深入 了 解 的 读者 可 参阅 
[ Goodman 1997; Kaaranen 2001; Lin 2001; Korhonen 2003; Schiller 2003; Palat 2009; 
Scourias 2012; Turner 2012; Akyildiz 2010 ] ， 以 及 特别 优秀 和 详尽 的 参考 资料 [Mouly 
1992; Sauter 2014 ] 。 
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4G 蜂窝 移动 与 无 线 LAN 的 比较 


许多 蜂窝 移动 电话 的 运营 者 正在 部 署 4G 蜂 窟 移动 系统 。 在 某 些 国家 (如 韩国 和 日 
本 )，4G LTE 履 盖 率 高 于 90% ， 即 几乎 是 无 所 不 在 。 在 2015 年 ， 已 部 署 的 LTE 系统 的 
平均 下 载 速率 ， 范 围 从 美国 和 印度 的 10Mbps 到 新 西 兰 的 接近 40Mbps。 这 些 4G 系统 部 
署 在 需要 许可 证 的 无 线 频带 中 ， 运 营 者 向 政府 支付 可 观 的 费用 来 获得 使 用 频谱 的 许可 
证 。4G 系统 以 一 种 与 现在 仅 蜂 窝 电 话 接 入 的 相似 方式 ， 允 许 用 户 在 移动 中 从 适 远 的 户 
外 位 置 接 入 因特网 。 在 许多 场合 中 ， 用 户 可 以 同时 接 入 无 线 LAN 和 4G。 对 于 4G 系统 
具有 的 更 为 受 限 和 更 为 昂贵 的 能 力 ， 许 多 移动 设备 在 两 者 都 可 用 时 ， 默 认 使 用 Wiki 而 
不 是 使 用 4G。 无 线 边 缘 网 络 接 入 将 主要 经 过 无 线 LAN 还 是 经 过 蜂窝 系统 仍 是 一 个 县 而 
未 决 的 问题 : 

© 新 兴 的 无 线 LAN 基础 设施 将 可 能 变 得 几乎 无 所 不 在 。 工 作 于 54Mbps 和 更 高 速 

率 的 IEEE 802. 11 无 线 LAN 已 经 得 到 了 广泛 部 署 。 几 乎 所 有 便携 计算 机 、 平 板 
电脑 和 智能 手机 出 厂 时 都 配 有 802.11 LAN 的 能 力 。 而 有 全， 新 兴 的 因特网 装置 
(例如 无 线 照相 机 和 相框 ) 也 具有 低 功率 的 无 线 LAN 能 力 。 

© ZR LAN 的 基站 也 能 处 理 移动 电话 装置 。 许 多 电话 已 经 能 够 直接 或 使 用 类 

Skype IP 语音 服务 与 蜂窝 电话 网 络 或 IP 网 络 连 接 ， 因 此 绕 过 运营 者 的 蜂窝 语音 
和 4G 数据 服务 。 

当然 ， 许 多 其 他 的 专家 相信 4G 不 仅 将 取得 巨大 的 成 功 ， 而且 也 将 使 我 们 工作 和 生 
活 的 方式 发 生 引 人 注目 的 革命 。WiFi 和 4G 很 可 能 都 会 成 为 流行 的 无 线 技术 ， 让 漫游 无 
线 设备 自动 选择 在 其 当前 所 处 物理 位 置 提供 最 好 服务 的 接 入 技术 。 











7.4.1 蜂窝 网 体系 结构 概述 


在 本 节 描 述 蜂窝 网 体系 结构 时 ， 我 们 将 采用 全 球 移动 通信 系统 (CSM) 标准 的 术语 。 
从 历史 的 角度 看 ， 首 字母 缩写 词 CSM 源 于 术语 “Groupe Spécial Mobile”， 后 来 才 采 用 了 更 
为 英文 化 的 名 字 ， 使 最 初 的 首 字 母 缩写 词 得 以 保留 。 到 了 20 世纪 80 年 代 ， 欧 洲 人 认识 到 
需要 一 个 泛 欧洲 的 数字 蜂窝 电话 系统 ， 以 代替 多 个 不 兼容 的 模拟 蜂窝 电话 系统 ， 从 而 导致 
T GSM 标准 的 出 现 [Mouly 1992 ] 。 欧 洲 人 在 20 世纪 90 年 代 初 就 成 功 地 部 署 了 GSM 技 
A, Ala GSM 成 长 为 移动 电话 领域 的 庞然大物 ， 全 世界 有 超过 80% 的 蜂窝 用 户 使 
用 GSM, 

当 人 们 谈论 蜂窝 技术 时 ， 经 常 将 该 技术 分 类 为 几 “ 代 ”之 一 。 最 早 一 代 的 设计 主要 用 
于 语音 通信 。 第 一 代 OC) 系统 是 模拟 FDMA 系统 ， 其 专门 用 于 语音 通信 。 这 些 1G 系统 
目前 几乎 绝迹 ， 它 们 被 数字 2G 系统 所 替代 。 初 始 的 2G 系统 也 是 为 语音 而 设计 ， 但 后 来 
除了 语音 服务 外 还 扩展 了 对 数据 〈 即 因特网 ) 的 支持 (2.56), 36 系统 也 支持 语音 和 数 
据 ， 但 更 为 强调 数据 能 力 和 更 高 速 的 无 线 电 接 人 链 路 。 今 天 正在 部 署 的 4G 系统 基于 LTE 
技术 ， 其 特征 为 全 卫 核心 网 络 ， 并 且 以 几 兆 比特 速率 提供 了 话音 和 数据 集成 。 

2G 蜂窝 网 体系 结构 : 语音 与 电话 网 连接 


术语 蜂窝 (cellular) 是 指 这 样 的 事实 ， 即 由 一 个 蜂窝 网 覆盖 的 区 域 被 分 成 许多 称 作 小 
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区 (cell) 的 地 理 覆 盖 区 域 ， 小 区 如 图 7-18 左 侧 的 六 边 形 所 示 。 如 同 在 7. 3. 1 节 中 学 习 的 
802. 11WiFi 标准 一 样 ，GSM 有 自己 的 特殊 命名 法 。 每 个 小 区 包含 一 个 收发 基站 (Base 
Transceiver Station ，BTS) ， 负 责 向 位 于 其 小 区 内 的 移动 站 点 发 送 或 接收 信号 。 一 个 小 区 的 
覆盖 区 域 取 决 于 许多 因素 ， 包 括 BTS 的 发 射 功率 、 用 户 设 备 的 传输 功率 、 小 区 中 的 障碍 建 
筑 物 以 及 基站 天 线 的 高 度 。 尽 管 图 7-18 中 显示 的 是 每 个 小 区 包含 一 个 位 于 该 小 区 中 间 的 
收发 基站 ， 但 今天 的 许多 系统 将 BTS 放置 在 3 个 小 区 的 交叉 处 ,使 得 具有 有 向 天 线 的 单个 
BTS 能 够 为 三 个 小 区 提供 服务 。 







” 收发 基站 (BTS) 
SS 基站 控制 器 (BSC) 
D 移动 交换 中 心 MSC) 


E = <p> 
4 


NDS cial 移动 用 户 
图 7-18 GSM 2G 蜂窝 网 体系 结构 的 组 件 


2G 蜂窝 系统 的 GSM 标准 对 空中 接口 使 用 了 组 合 的 FDMZTDM (无 线 电 )。 第 1 章 中 讲 
过 ， 使 用 纯 FDM， 信 道 被 划分 成 许多 频段 ， 每 个 呼叫 分 配 一 个 频段 。 第 1 章 也 讲 过 ， 使 用 纯 
TDM， 时 间 被 划分 为 帧 ， 每 个 帧 又 被 进一步 划分 为 时 隙 ,每 个 呼叫 在 循环 的 帧 中 被 分 配 使 用 
特定 的 时 际 。 在 组 合 的 FDMATDM 系统 中 ， 信 道 被 划分 为 若干 频率 子 带 ; 对 于 每 个 子 带 ， 时 
间 又 被 划分 为 帧 和 时 隙 。 因 此 ， 对 于 一 个 组 合 的 FDMZTDM 系统 ， 如 果 信 道 被 划分 为 了 个子 
带 ， 并 且 时 间 被 划分 为 了 个 时 隙 ， 那 么 该 信道 将 能 够 支持 下 .了 个 并 发 的 呼叫 。 我 们 在 6.3.4 
节 中 看 到 ， 电 缆 接 入 网 也 使 用 了 组 合 的 FDMATDM 方法 。GSM 系统 由 多 个 200kHz 的 频带 组 
成 ， 每 个 频带 支持 8 个 TDM FEI, GSM 以 13kbps 和 12. 2kbps 的 速率 编码 。 

一 个 GSM 网 络 的 基站 控制 器 (Base Station Controller, BSC) 通常 服务 于 几 十 个 收发 
基站 。BSC 的 责任 是 为 移动 用 户 分 配 BTS ERR, WITE (paging) ( 找 出 某 移动 用 
户 所 在 的 小 区 ) ， 执 行 移动 用 户 的 切换 (切换 是 我 们 将 在 7.7.2 节 中 涉及 的 主题 ) 。 基 站 控 
制 器 及 其 控制 的 收发 基站 共同 构成 了 GSM 基站 系统 (Base Station System, BSS) 。 

我 们 将 在 7.7 节 中 看 到 ， 在 用 户 鉴 别 和 账户 管理 (决定 是 否 人 允许 某 个 移动 设备 与 蜂窝 
网 络 连接 ) 以 及 呼叫 建立 和 切换 中 ， 移 动 交 换 中 心 (Mobile sWitching Center, MSC) 起 着 
决定 性 的 作用 。 单 个 MSC 通常 将 包含 多 达 5 个 BSC， 因 此 每 个 MSC 有 大 约 200 000 个 用 
户 。 一 个 蜂 窒 提 供 商 的 网 络 将 有 若干 MSC， 使 用 称 为 网 关 MSC 的 特殊 MSC 将 提供 商 的 蜂 
窝 网络 与 更 大 的 公共 电话 网 相连 。 


7.4.2 3G 蜂窝 数据 网 : 将 因特网 扩展 到 蜂窝 用 户 
我 们 在 7.4. 1 节 中 的 讨论 关注 了 蜂窝 语音 用 户 连接 到 公共 电话 网 。 但 当 我 们 开始 这 样 
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干 时 ， 当 然 也 乐意 读 电 子 邮件 、 访 问 Web、 获 取 位 置 相 关 的 服务 (例如 地 图 和 和 餐馆 推荐 ) ， 
或 许 甚至 观看 流 式 视频 。 为 此 ， 我 们 的 智能 手机 需要 运行 完整 的 TCP/IP 协议 栈 (包括 物 
理 层 、 链 路 层 、 网 络 层 、 运 输 层 和 应 用 层 ) ， 并 能 够 经 过 蜂窝 数据 网 连接 进入 因特网 。 随 
着 一 代 CAPER) 继承 一 代 ， 以 及 引入 许多 具有 新 首 字母 缩 略 词 的 新 技术 和 服务 ， 蜂 窝 数 
据 网 的 主题 是 一 个 相当 令 人 眼花 综 乱 的 竞争 和 不 断 演化 的 标准 集合 ， 这 个 标准 集合 相当 令 
人 迷惑 。 更 糟糕 的 是 ， 没 有 单一 的 官方 机 构 对 2.5G、3G、3.5G 4G 技术 提出 要 求 ， 难 
以 理 清 这 些 竞争 性 标准 之 间 的 差异 。 在 我 们 下 面 的 讨论 中 ， 我们 将 关注 由 第 三 代 合作 伙伴 
项 目 (3rd Generation Partnership Project, 3GPP) 研发 的 通用 移动 通信 服务 (Universal Mo- 
bile Telecommunications Service, UMTS) 3G 和 4G 标准 [3GPP 2016 ] 。 
我 们 自 上 而 下 地 查看 一 下 显示 在 图 7-19 中 的 3G 蜂窝 数据 网 体系 结构 。 


公共 电话 网 










(WCDMA, HSPA) 


< 无线电 接 入 网 核心 网 
通用 陆地 无 线 接 入 网 通用 分 组 无 线 服务 因特网 
(UTRAN) (GPRS) 核心 网 





zi . 
Ey : 


服务 GPRS 支 持 ”网关 GPRS 支 持 
节点 (SGSN) ”节点 (GGSN) 


图 7-19 36 系统 体系 结构 


1. 3G 核心 网 

3G 核心 蜂窝 数据 网 将 无 线 电 接 入 网 连接 到 公共 因特网 。 核 心 网 与 我 们 前 面 在 图 7-18 中 
过 到 过 的 现 有 蜂窝 语音 网 特别 是 MSC) 的 组 件 协 作 。 由 于 在 现 有 的 蜂窝 语音 网 中 具有 大 量 
的 现 有 基础 设施 (有利 可 图 的 服务 !) ，3G 数据 服务 的 设计 者 们 所 采取 的 方法 非常 清楚 : 不 
去 触动 现 有 核心 CSM 蜂窝 语音 网 ， 增 加 与 现 有 蜂窝 语音 网 平行 的 附加 蜂窝 数据 功能 。 如 果 
将 新 的 数据 服务 直接 增加 到 现 有 的 蜂窝 语音 网 上 ， 这 种 方法 同样 会 引发 4.3 节 中 遇 到 过 的 挑 
战 一 一 在 前 面 我 们 讨论 了 在 因特网 中 新 的 (IPv6) 和 旧 的 《IPv4) 集成 的 技术 。 
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在 3G 核心 网 中 有 两 类 节点 : 服务 通用 分 组 无 线 服务 支持 节点 (Serving Generalized 
packet radio service Support Node, SGSN) 和 网 关 GPRS 支持 节点 (Gateway GPRS Support 
Node, GGSN), (GPRS (General Packet Radio Service) 表示 通用 分 组 无 线 服 务 ， 这 是 一 种 
在 2G 网 络 中 的 早期 蜂窝 数据 服务 ; 这 里 我 们 讨论 的 是 在 3G 网络 中 GPRS 的 演化 版 本 。) 
一 个 SGSN 负责 向 位 于 其 连接 的 无 线 电 接 入 网 中 的 移动 节点 交付 (或 从 移动 节点 获取 ) 数 
据 报 。SGSN 与 该 区 域 蜂 帘 语 音 网 的 MSC 进行 交互 ， 提 供用 户 认证 和 切换 ， 维 护 活 跃 移动 
节点 的 位 置 (小 区 ) 信息 ， 执 行 位 于 无 线 接 入 网 中 的 移动 节点 和 GGSN 之 间 的 数据 报 转 
发 。GGSN 起 着 网 关 的 作用 ， 将 多 个 SGSN 连接 到 更 大 的 因特网 。GGSN 因此 是 源 于 移动 节 
点 的 一 个 数据 报 在 进入 更 大 因特网 之 前 遇 到 的 3G 基础 设施 的 最 后 一 部 分 。 对 外 部 而 言 ， 
GGSN 看 起 来 像 任何 其 他 网 络 路 由 器 ， 从 外 面 看 来 ，GGSN 网 络 中 3G 节点 的 移动 性 隐藏 在 
GGSN 背后 。 

2. 3G 无 线 电 接 入 网 : 无线 边缘 

3G 无 线 电 接 入 网 (radio access network) 是 我 们 作为 3G 用 户 看 见 的 无 线 第 一 跳 网 络 。 
无 线 电网 络 控制 器 ( Radio Network Controller, RNC) 通常 控制 几 个 小 区 的 收发 基站 ， 类 似 
于 我 们 在 2G 网 络 中 遇 到 的 基站 (但 是 3G UMTS 的 正式 用 语 称 为 一 个 “节点 B”， 这 是 一 
个 相当 不 具 描 述 性 名 字 !) 。 每 个 小 区 的 无 线 链 路 运行 在 移动 节点 和 收发 基站 之 间 ， 就 像 在 
2G 网 络 中 那样 。RNC 既 通过 MSC 与 电路 交换 蜂窝 语音 网 连接 ， 又 通过 SGSN 与 分 组 交换 
的 因特网 连接 。 因 此 ， 尽 管 3G 蜂窝 语音 服务 和 蜂 窗 数 据 服务 使 用 不 同 的 核心 网 ， 但 它们 
共享 一 个 相同 的 第 一 /最 后 一 跳 无 线 电 接 人 网 。 

较 之 2G 网 络 ， 在 3G UMTS 中 的 一 个 重大 变化 是 不 再 使 用 GSM 的 FOMA/TDMA 方案 ， 
UMTS 在 TDMA 时 隙 中 使 用 称 为 直接 序列 宽带 CDMA (Direct Sequence Wideband CDMA, 
DS-WCDMA) 的 CDMA 技术 [Dahlman 1998], TDMA 时 隙 又 在 多 个 频率 上 可 供 使 用 ， 即 
有 趣 地 使 用 了 我 们 在 前 面 第 6 章 指 出 的 全 部 三 种 不 同 的 信道 共享 方法 ， 并 且 类 似 于 有 线 电 
缆 接 人 网 中 所 采用 的 方法 (参见 6. 3.4 节 )。 这 种 变化 要 求 一 个 新 的 3G 蜂窝 无 线 接 人 网 与 
显示 在 图 7-19 中 的 2G BSS 无 线 电网 络 并 行 运行 。 与 WCDMA 规范 相关 的 数据 服务 被 称 为 
高 速 分 组 接 入 (High Speed Packet Access，HSPA) ， 其 下 行 数 据 传 输 率 有 望 高 达 14Mbps。 
AK 3G 网 络 的 细节 能 够 在 3CPP Web 站 点 上 找到 [3GPP 2016 ] 。 


7.4.3 走向 4G: LTE 


第 四 代 (4G) 蜂窝 系统 正在 广泛 部 署 中 。 在 2015 年 ， 有 50 多 个 国家 的 4G 覆盖 率 超 
过 50% 。 由 3GPP 提出 的 4G 长 期 演进 互联 网 (LTE) 标准 [Sauter 2014]， 较 之 3G 系统 
而 言 有 两 个 重要 的 创新 : 一 个 全 IP 核心 网 和 一 个 加 强 的 无 线 电 接 人 网 。 下 面 对 此 进行 
讨论 。 
1. 4G 系统 体系 结构 : 一 个 全 IP 核心 网 
图 7-20 显示 了 总 体 的 4G 网 络 体系 结构 ， 它 (不幸 地 ) 又 引入 男 一 个 (相当 难以 理 
解 的 ) 新 词汇 以 及 一 些 网 络 组 件 的 首 字 母 缩写 词 。 但 我 们 不 要 被 这 些 首 字母 缩写 词 搞 尝 ! 
有 关 4G 体系 结构 ， 有 两 个 重要 的 高 层次 观察 。 
e 一 种 统一 的 、 全 了 四 网 络 体系 结构 。 与 图 7-19 显示 的 3G MAA, 36 网 络 对 于 语 
音 和 数据 流量 具有 分 离 的 网 络 组 件 和 路 径 ， 显 示 在 图 7-20 中 的 4G 体系 结构 是 
“全 "的 "， 即 语音 和 数据 都 承载 在 IP 数据 报 中 , 来自/ 去 往 无 线 设 备 ( 用户 设 
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Z, 4G 的 术语 为 UE) ， 到 分 组 网 关 (P-CW) 一 一 该 P-GW 将 4G 边缘 网 络 连接 到 
网 络 的 其 他 部 分 。 使 用 了 4G， 蜂 窝 网 络 来 源 于 电话 的 最 后 痕迹 已 经 荡然 无 存 ， 让 
位 给 统一 的 下 服务 了 ! 





E-UTRAN 
无 线 电 接 入 网 全 IP 加 强 分 组 核 (EPC) 


图 7-20 4G 网 络 体系 结 构 


4G 数据 平面 与 4G 控制 平面 的 清晰 分 离 。 分 别 对 照 第 4 章 和 第 5 章 中 IP 网 络 层 的 
数据 平面 与 控制 平面 之 间 的 特征 ，4G 网 络 体系 结构 也 清晰 地 分 离 了 数据 平面 和 控 
制 平 面 。 我 们 将 在 下 面 讨 论 它们 的 功能 。 
无 线 电 接 入 网 与 全 耳 核心 网 之 间 的 清晰 分 离 。 承 载 用 户 数据 的 卫 数据 报 经 过 通 往 
外 部 因特网 的 内 部 4G IP 网 络 ， 在 用 户 (UE) 和 网 关 (图 7-20 中 的 P-GW) 之 间 
转发 。 在 4G 控制 服务 组 件 之 间 经 过 相同 的 内 部 网 络 交 换 控制 分 组 ， 这 些 组 件 的 作 
用 将 在 下 面 描述 。 l 

4G 体系 结构 的 主要 组 件 如 下 : 
eNodeB 是 2G 基站 和 3G 无线 电网 络 控制 器 〈 又 称 为 节点 B) 的 逻辑 后 代 ， 并 且 
此 时 还 起 着 关键 作用 。 它 的 数据 平面 作用 是 在 UE 和 了 P-GW 之 间 (经 过 LTE 无 线 
电 接 入 网 ) 转发 数据 报 。UE 数据 报 在 eNodeB 被 封装 ， 并 且 通 过 4G MAH IP 
强化 分 组 核 (EPC) 以 隧道 形式 传输 到 P-GW。eNodeB 与 P-GW 之 间 的 隧道 类 似 
于 我 们 在 4. 3 节 中 看 到 的 IPv6 数据 报 隧 道 ， 这 些 分 组 在 两 个 IPv6 端点 之 间 通 过 一 
个 使 用 IPv4 路 由 器 的 网 络 传输 。 这 些 隧道 可 能 与 保证 服务 质量 (QoS) 相关 。 例 
如 ，4G 网 络 可 能 确保 语音 流量 在 UE 和 P-GW 之 间 历 经 不 超过 100ms 时 延 ， 分 组 
丢失 率 小 于 1% ; TCP 流量 也 许 能 够 确保 300ms 时 延 以 及 小 于 0. 0001% 的 分 组 丢 
失 率 [Palat 2009 ] 。 我 们 将 在 第 9 章 涉 及 QoS。 在 控制 平面 中 ，eNodeB 代表 UE 来 
处 理 注册 和 移动 性 信 令 流量 。 
分 组 数据 网 络 网 关 (Packet Data Network Gateway, P-GW) 给 UE 分配 四 地 址 ， 并 
且 保 证 QoS 实施 。 作 为 隧道 端点 ， 当 向 或 从 UE 转发 数据 报时 ， 它 也 执行 数据 报 
封装 / 解 封 装 。 
服务 网 关 (S-GW) 是 数据 平面 移动 性 锚 点 ， 即 所 有 UE 流量 将 通过 S- GW 传递 。 
该 S-GW 也 执行 收费 / 记 账 功能 以 及 法 定 的 流量 拦截 。 
移动 性 管理 实体 (Mobility Management Entity, MME) 代表 位 于 它 所 控制 单元 中 的 
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UE ， 执 行 连接 和 移动 性 管理 。 它 从 HHS 接收 UE 订购 信息 。 我 们 在 7.7 节 中 详细 
讨论 蜂窝 网 络 中 的 移动 性 。 
。 归属 用 户 服务 (Home Subscriber Server，HSS) 包含 了 包括 漫游 接 入 能 力 、 服 务 质 
量 配 置 文件 和 鉴别 信息 的 UE 信息 。 如 我 们 在 7.7 节 中 所 见 ， 该 HSS 从 UE 归属 蜂 
窝 提 供 商 得 到 这 些 信 息 。 
[ Motorola 2007; Palat 2009; Sauter 2014] 对 4G 网 络 体系 结构 及 其 EPC 做 了 可 读 性 很 
强 的 介绍 。 
2. LTE 无 线 电 接 人 网 
LTE 在 下 行 信道 采用 频 分 复 用 和 时 分 复 用 结合 的 方法 ， 称 之 为 正 交 频 分 复 用 (Orthog- 
onal Frequency Division Multiplexing, OFDM) 技术 [Rohde 2008; Ericsson 2011]。(“ 正 交 ” 
一 词 来 源 于 如 下 事实 ， 所 生成 的 在 不 同 频道 上 发 送 的 信和 号， 它们 相互 干扰 非常 小 ， 即 使 当 信 
道 频率 紧密 排列 时 ) 。 在 LTE 中 ， 每 个 活 
路 的 移动 节点 都 可 以 在 一 个 或 更 多 个 信 
道 频率 上 被 分 配 一 个 或 更 多 个 0. Sms 时 
BR. K 7-21 显示 了 在 4 个 频率 上 分 配 8 
个 时 际 的 情况 。 通 过 分 配 越 来 越 多 的 时 
Bat (无 论 是 用 相同 的 频率 还 是 用 不 同 的 
频率 ) ， 移 动 节 点 能 够 获取 越 来 越 高 的 传 
输 速 率 。 在 移动 节点 之 间 进 行 时 际 ( 重 ) 
分 配 的 频 度 为 每 毫秒 一 次 。 不 同 的 调制 
方案 也 能 用 于 改变 传输 速率 ， 参 见 我 们 phe 
前 面 对 图 733 的 讨论 以 及 WiFi 网 络 中 调 0 0.5 He TS "20 “25 90 95 10.0 
制 方案 的 动态 选择 。 图 7-21 在 每 个 频率 上 ，20 个 0.5ms 的 时 隙 组 成 
LTE 标准 并 未 对 向 移动 节点 特殊 分 10ms 帧 。 阴 影 显示 了 一 个 8 ET BRT AC 
配 时 隙 进行 强制 要 求 。 相 反 ， 人 允许 哪个 移动 节点 在 某 个 给 定 的 时 隙 在 给 定 的 频率 下 传输 ， 
这 个 决定 由 LTE 设备 商 和 /或 网 络 运 营 商 提供 的 调度 算法 来 做 出 。 使 用 机 会 调度 [Bender 
2000; Kolding 2003; Kulkarni,2005 ] ， 将 物理 层 协议 与 发 送 方 和 接收 方 之 间 的 信道 条 件 相 
匹配 ， 基 于 信道 条 件 选择 分 组 将 发 往 的 接收 方 ， 使 无 线 电网 络 控制 器 能 够 最 大 限度 地 利用 
无 线 媒体 。 此 外 ， 能 够 使 用 用 户 优 先 权 和 服务 的 契约 等 级 〈 如 银 、 金 或 铂金 ) 调度 下 行 分 
组 传输 。 除 了 上 面 描述 的 LTE 能 力 ， 高 级 LTE 通过 向 移动 节点 分 配 聚 合 信 和 道 提供 了 数 百 
兆 下 行 带宽 [Akyildiz 2010] 。 
另 一 种 4G 无 线 技术 是 WiMAX (全球 微波 接 入 互 操作 )， 它 是 一 个 正 EE 802. 16 标准 
协议 簇 ; 与 LIE 有 着 重大 差异 。WiMAX 目前 还 没有 得 到 LTE 那样 的 广泛 部 署 ， 它 的 详细 
讨论 能 够 在 本 书 的 Web 站 点 上 找到 。 


7.5 移动 管理 : 原理 


学 习 了 无 线 网 络 中 通信 链 路 的 无 线 特 性 后 ， 现 在 我 们 将 注意 力 转向 这 些 无 线 链 路 带 来 
的 移动 性 。 宽 泛 地 讲 ， 移 动 节点 是 随时 间 改 变 它 与 网 络 连接 位 置 的 节点 。 因 为 移动 性 这 一 
术语 在 计算 机 界 和 电话 界 有 许多 含义 ， 所 以 先 更 为 详细 地 讨论 一 下 移动 性 的 各 个 方面 将 对 
我 们 很 有 帮助 。 
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e 从 网 络 层 的 角度 看 ， 用 户 如 何 移动 ? 一 个 物理 上 移动 的 用 户 将 对 网 络 层 提 出 一 系 
列 不 同 寻常 的 挑战 ， 这 取决 于 他 《她 ) 在 网 络 连接 点 之 间 如 何 移动 。 在 图 7-22 中 
的 移动 程度 谱 的 一 端 ， 用 户 也 许 带 着 一 台 装 有 无 线 网 络 接口 卡 的 便携 机 在 一 座 建 
筑 物 内 走动 。 如 我 们 在 7. 3.4 节 中 所 见 ， 从 网 络 层 的 角度 来 看 ， 该 用 户 并 没有 移 
动 。 而 且 ， 如 果 该 用 户 不 论 在 何 处 都 与 同一 个 接 入 点 相关 联 ， 从 链 路 层 角 度 来 看 
该 用 户 甚至 也 没有 移动 。 

在 该 移动 程度 谱 的 另 一 端 ， 考 虑 一 下 该 用 户 在 一 辆 宝马 或 特 斯 拉 轿 车 内 以 
150km/h 的 时 速 沿 高 速 公路 急速 行驶 时 穿 过 多 个 无 线 接 和 网， 并 希望 在 整个 旅程 
中 保持 一 个 与 远程 应 用 的 不 间断 的 TCP 连接 。 这 个 用 户 无 疑 是 移动 的 ! 在 这 两 种 
极端 之 间 的 情况 是 ,一 个 用 户 带 着 一 台 便 携 机 从 一 个 地 方 ( 如 办 公 室 或 宿舍 ) 到 
另 一 个 地 方 〈《 如 咖啡 店 、 教 室 ) ， 并 且 想 在 新 地 方 连 人 网 络 。 该 用 户 也 是 移动 的 
(虽然 比 “宝马 ”驾驶 员 的 移动 性 差 一 些 !) ， 只 不 过 不 需要 在 网 络 接 入 点 之 间 移 
动 时 维持 一 个 不 间断 的 连接 。 图 7-22 从 网 络 层 角 度 阐 明了 用 户 移动 性 的 程度 谱 。 
无 移动 性 高 移动 性 
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用 户 仅 在 相同 用 户 在 接 入 网 之 间 用 户 在 接 入 网 之 
的 无 线 接 入 网 中 移动 ， 当 在 网 间 移 动 间 移 动 ， 同 时 维持 
移动 时 关闭 连接 进行 中 的 连接 


图 7-22 ”从 网 络 层 观点 来 看 各 种 程度 的 移动 性 


© 移动 节点 的 地 址 始终 保持 不 变 有 多 人 么 重要 ? 对 移动 电话 而 言 ， 当 你 从 一 个 提供 商 
移动 电话 网 络 到 另 一 个 的 过 程 中 ， 你 的 电话 号 码 (本 质 上 是 你 电话 的 网 络 层 地 址 ) 
始终 保持 不 变 。 类 似 地 ， 便 携 机 在 UP 网 络 之 间 移 动 时 是 否 也 必须 维持 相同 的 全 地 
址 呢 ? 

对 这 一 问题 的 回答 很 大 程度 上 取决 于 所 运行 的 应 用 程序 。 对 于 那个 在 高 速 公 
路 上 飞驰 ， 同 时 又 希望 维持 对 一 个 远程 应 用 的 不 间断 的 TCP 连接 的 宝马 或 特 斯 拉 
司机 而 言 ， 维 持 相 同 的 IP 地 址 将 会 带 来 便利 。 回 想 第 3 章 ， 一 个 因特网 应 用 程序 
需要 知道 它 与 之 通信 的 远 端 实体 的 下地 址 和 端口 号 。 如 果 一 个 移动 实体 在 移动 过 
程 中 能 够 保持 其 卫 地 址 不 变 ， 从 应 用 的 角度 ， 移 动 性 就 变 得 不 可 见 。 这 种 透明 性 
有 十 分 重要 的 价值 ， 即 应 用 程序 不 必 关 心 IP 地 址 潜在 的 变化 ， 并 且 同 样 的 应 用 程 
序 代码 既 可 用 于 移动 连接 ， 又 可 用 于 非 移 动 连接 。 在 下 一 节 我 们 将 会 看 到 移动 IP 
提供 了 这 种 透明 性 ， 它 允许 移动 节点 在 网 络 间 移动 的 同时 维持 其 永久 的 IP 地 址 。 

在 另 一 方面 ， 一 个 不 太 喜 欢 新 潮 的 移动 用 户 也 许 只 想 关 闭 办 公 室 便携 机 ， 将 
其 带 回 家 ， 然 后 开机 ， 再 在 家 中 工作 。 如 果 该 便携 机 在 家 时 只 是 作为 一 个 客户 ， 
使 用 客户 -服务 器 方式 的 应 用 (如 发 送 /阅读 电子 邮件 、 浏 览 Web 、 通 过 Telnet 与 
远程 主机 相连 ) ， 则 使 用 特定 IP 地 址 并 不 是 那么 重要 。 特 别 是 ， 用 户 能 够 得 到 一 
个 由 服务 于 家 庭 的 ISP 临时 分 配 的 全 地 址 即 可 。 我 们 在 4. 3 节 中 看 到 的 DHCP H 
供 了 这 种 功能 。 

© 支持 有 线 基 础 设施 的 东西 有 哪些 可 用 ? 在 所 有 上 述 情 形 中 ， 我 们 都 隐 含 地 假设 
存在 一 个 固定 的 基础 设施 让 移动 用 户 连接 ， 例 如 家 庭 的 ISP 网 络 、 办 公 室 的 无 
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线 接 入 网 ,或 者 沿 高 速 公路 的 无 线 接 入 网 。 如果 这 样 的 基础 设施 不 存在 会 怎么 
样 ? 如 果 两 个 用 户 位 于 彼此 的 通信 范围 内 ， 他 们 能 否 在 没有 其 他 网 络 基 础 设施 
存在 的 情况 下 建立 一 个 网 络 连 接 ? 自 组 织 网 络 正 好 提供 了 这 些 能 力 。 这 一 飞速 
发 展 的 领域 位 于 移动 网 络 研究 的 前 沿 ， 超 出 了 本 书 的 范围 。 [ Perkins 2000] 和 
IETF 移动 自 组 织 网 络 (manet) 工作 组 主页 [manet 2016] 提供 了 有 关 这 一 主题 
的 详尽 讨论 。 

为 了 阐述 允许 移动 用 户 在 不 同 网 络 间 移 动 过 程 中 维持 正在 进行 的 连接 所 涉及 的 问 
题 ， 我 们 考虑 一 个 人 类 的 类 比例 子 。 一 位 20 岁 左右 的 青年 从 家 里 搬出 ， 成 为 流动 的 人 ， 
在 一 些 宿舍 或 公寓 居住 ， 并 经 常 改换 住址 。 如 果 一 个 老 朋 友 想 与 他 联系 ， 这 位 朋友 怎样 
才能 找到 这 个 流动 的 朋友 呢 ? 一 种 常用 的 方法 是 与 他 的 家 庭 取 得 联系 ， 因 为 一 位 流动 的 
青年 通常 会 将 其 目前 的 地 址 告诉 家 里 〈 即 使 没有 其 他 原因 ， 哪 怕 只 是 为 了 让 父母 寄 钱 来 
帮 他 付 房租 ) 。 其 家 庭 由 于 有 一 个 永久 地 址 ， 因 此 成 为 其 他 想 与 该 流动 青年 联系 的 人 可 
采用 的 第 一 步 。 这 些 朋 友 后 来 与 他 的 通信 也 许 是 间接 的 〈 如 先 将 邮件 发 送 到 其 父母 家 ， 
再 转发 给 该 流动 的 青年 ) ， 也 许 是 直接 的 〈 如 该 朋友 用 得 到 的 地 址 直接 将 邮件 发 送 给 其 
流动 的 朋友 ) o 

在 一 个 网 络 环境 中 ， 一 个 移动 节点 〈 如 一 台 便 携 机 或 智能 手机 ) 的 永久 居所 被 称 为 归 - 
属 网 络 (home network) ， 在 归属 网 络 中 代表 移动 节点 执行 下 面 讨论 的 移动 管理 功能 的 实体 
叫 归 属 代理 (home agent) 。 移 动 节点 当前 所 在 网 络 叫 作 外 部 网 络 (foreign network) 或 被 
访 网 络 (visited network) ， 在 外 部 网 络 中 帮助 移动 节点 做 移动 管理 功能 的 实体 称 为 外 部 代 
理 (foreign agent) 。 对 于 移动 的 专业 人 员 而 言 ， 他 们 的 归属 网 络 可 能 就 是 其 公司 网 络 ， 而 
被 访 网 络 也 许 就 是 他 们 正 访问 的 某 同行 所 在 的 网 络 。 一 个 通信 者 (correspondent) 就 是 希 
望 与 该 移动 节点 通信 的 实体 。 图 7-23 阐述 了 这 些 概 念 ， 也 说 明了 下 面 考虑 的 编 址 概念 。 
在 图 7-23 中 ,我 们 注意 到 代理 被 配置 在 路 由 器 上 例如， 作为 在 路 由 器 上 运行 的 进程 ) ， 
但 它们 也 能 在 网 络 中 其 他 主机 或 服务 器 上 执行 。 





7-23 ”移动 网 络 体系 结构 中 的 初始 要 素 
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7.5.1 寻 址 


我 们 前 面 提 到 为 了 使 用 户 移动 性 对 网 络 应 用 透明 ， 和 希望 一 个 移动 节点 在 从 一 个 网 络 移 
动 到 另 一 个 网 络 时 保持 其 地 址 不 变 。 当 某 移动 节点 位 于 一 个 外 部 网 络 时 ， 所 有 指向 此 节点 
固定 地 址 的 流量 需要 导向 外 部 网 络 。 怎 样 才能 做 到 这 一 点 呢 ? 外 部 网 络 可 用 的 一 种 方法 就 
是 向 所 有 其 他 网 络 发 通告 ， 告 诉 它们 该 移动 节点 正在 它 的 网 络 中 。 这 通常 可 通过 交换 域内 
与 域 间 路 由 选择 信息 来 实现 ， 而 且 只 需 对 现 有 路 由 选择 基础 设施 做 很 少 的 改动 即 可 。 外 部 
网 络 只 需 通告 其 邻居 它 有 一 条 非常 特别 的 路 由 能 到 达 该 移动 节点 的 固定 地 址 ， 即 告诉 其 他 
网 络 它 有 一 条 正确 的 路 径 可 将 数据 报导 向 该 移动 节点 的 固定 地 址 ( 即 基本 上 是 通知 其 他 网 
络 ， 它 有 一 条 可 将 数据 报 路 由 选择 到 该 移动 节点 的 永久 地 址 的 正确 路 径 ; 参见 4.3 节 )。 
这 些 邻 居 将 在 全 网 传播 该 路 由 选择 信息 ， 而 且 是 当 作 更 新 路 由 选择 信息 和 转发 表 的 正常 过 
程 的 一 部 分 来 做 。 当 移动 节点 离开 一 个 外 部 网 络 后 又 加 入 另 一 个 外 部 网 络 时 ， 新 的 外 部 网 
络 会 通告 一 条 新 的 通 向 该 移动 节点 的 特别 路 由 ， 旧 的 外 部 网 络 将 撤销 其 与 该 移动 节点 有 关 
的 路 由 选择 信息 。 

这 种 方法 立刻 解决 了 两 个 问题 ， 且 它 这 样 做 不 需 对 网 络 层 基 础 设施 做 重大 改动 。 其 他 
网 络 知道 该 移动 节点 的 位 置 ， 很 容易 将 数据 报 路 由 到 该 移动 节点 ， 因 为 转发 表 将 这 些 数据 
报导 向 外 部 网 络 。 然 而 它 有 一 个 很 大 的 缺陷 ， 即 扩展 性 不 好 。 如 果 移 动 性 管理 是 网 络 路 由 
器 的 责任 的 话 ， 则 路 由 器 将 必须 维护 可 能 多 达 数 百 万 个 移动 节点 的 转发 表 表 项 。 在 本 章 后 
面 的 习题 中 将 探讨 一 些 其 他 的 缺陷 。 

一 种 替代 的 方法 〈 并 在 实际 中 得 到 了 采用 ) 是 将 移动 性 功能 从 网 络 核心 搬 到 网 络 边 
缘 ， 这 是 我 们 在 研究 因特网 体系 结构 时 一 再 重复 的 主题 。 一 种 自然 的 做 法 是 由 该 移动 节点 
的 归属 网 络 来 实现 。 与 那个 流动 青年 的 父母 跟踪 他 们 孩子 的 位 置 有 许多 相似 之 处 ， 在 移动 
节点 的 归属 网 络 中 的 归属 代理 也 能 跟踪 该 移动 节点 所 在 的 外 部 网 络 。 这 当然 需要 一 个 移动 
节点 (或 一 个 代表 该 移动 节点 的 外 部 代理 ) 与 归属 代理 之 间 的 协议 来 更 新 移动 节点 的 
位 置 。 

我 们 现在 更 详细 地 思考 外 部 代理 。 如 图 7-23 所 示 ， 概 念 上 最 简单 的 方法 是 将 外 部 代理 
放置 在 外 部 网 络 的 边缘 路 由 器 上 。 外 部 代理 的 作用 之 一 就 是 为 移动 节点 创建 一 个 所 谓 的 转交 
地 址 (Care-Of Address, COA), 该 COA 的 网 络 部 分 与 外 部 网 络 的 网 络 部 分 相 匹配 。 因 此 一 
个 移动 节点 可 与 两 个 地 址 相关 联 ， 即 其 永久 地 址 (permanent address) (类 比 于 流动 青年 的 家 
庭 地 址 ) 与 其 COA, 该 COA 有 时 又 称 为 外 部 地 址 (foreign address) (类比 于 流动 青年 当前 居 
住 的 房屋 地 址 ) 。 在 图 7-23 中 的 例子 中 ， 移 动 节点 的 固定 地 址 是 128. 119. 40. 186。 当 被 访 网 
络 为 79. 129. 13/24 时 ， 该 移动 节点 具有 的 COA 为 79. 129. 13.2。 外 部 代理 的 第 二 个 作用 就 是 
告诉 归属 代理 ， 该 移动 节点 在 它 的 〈 外 部 代理 的 ) 网 络 中 且 具 有 给 定 的 COA。 我 们 很 快 就 会 
看 到 ， 该 COA 将 用 于 将 数据 报 通过 外 部 代理 “重新 路 由 选择 ”到 移动 节点 。 

虽然 我 们 已 将 移动 节点 与 外 部 代理 的 功能 分 开 ， 但 是 应 当 注意 到 移动 节点 也 能 承担 外 
部 代理 的 责任 。 例 如 ， 某 移动 节点 可 在 外 部 网 络 中 得 到 一 个 COA (使 用 一 个 诸如 DHCP 之 
类 的 协议 ) ， 且 由 它 自 己 把 其 COA 通告 给 归属 代理 。 


7.5.2 路 由 选择 到 移动 节点 


我 们 现在 已 看 到 一 个 移动 节点 是 如 何 得 到 一 个 COA 的 ， 归 属 代理 又 是 如 何 被 告知 该 
地 址 的 。 但 让 归属 代理 知道 该 COA 仅 能 解决 部 分 问题 。 数 据 报应 怎样 寻 址 并 转发 给 移动 
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节点 呢 ? 因 为 只 有 归属 代理 (而 不 是 全 网 的 路 由 器 ) 知道 该 移动 节点 的 位 置 ， 故 如 果 只 是 
将 一 个 数据 报 寻 址 到 移动 节点 的 永久 地 址 并 将 其 发 送 到 网 络 层 基础 结构 中 ， 这 样 做 已 不 再 
满足 需要 了 。 还 有 更 多 的 事情 要 做 。 目 前 有 两 种 不 同 的 方法 ， 我 们 将 称 其 为 间接 路 由 选择 
与 直接 路 由 选择 。 

1. 移动 节点 的 间接 路 由 选择 


我 们 先 考虑 一 个 想 给 移动 节点 发 送 数据 报 的 通信 者 。 在 间接 路 由 选择 (indirect rou- 
ting) 方法 中 ， 通 信者 只 是 将 数据 报 寻 址 到 移动 节点 的 固定 地 址 ， 并 将 数据 报 发 送 到 网 络 
中 去 ， 完 全 不 知道 移动 节点 是 在 归属 网 络 中 还 是 正在 访问 某 个 外 部 网 络 ， 因 此 移动 性 对 于 
通信 者 来 说 是 完全 透明 的 。 这 些 数据 报 就 像 平 常 一 样 首 先导 向 移动 节点 的 归属 网 络 。 这 用 
图 7-24 中 的 步骤 1 加 以 说 明 。 
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图 7-24 对 移动 节点 的 间接 路 由 选择 


我 们 现在 将 注意 力 转向 归属 代理 。 除 了 负责 与 外 部 代理 交互 以 跟踪 移动 节点 的 COA 
外 ， 归 属 代理 还 有 另 一 项 很 重要 的 功能 。 它 的 第 二 项 工作 就 是 监视 到 达 的 数据 报 ， 这 些 数 
据 报 寻 址 的 节点 的 归属 网 络 与 该 归属 代理 所 在 网 络 相同 ， 但 这 些 节点 当前 却 在 某 个 外 部 网 
络 中 。 归 属 代 理 截 获 这 些 数 据 报 ， 然 后 按 一 个 两 步骤 的 过 程 转发 它们 。 通 过 使 用 移动 节点 
的 COA， 该 数据 报 先 转发 给 外 部 代理 (图 7-24 中 的 步骤 2) ， 然 后 再 从 外 部 代理 转发 给 移 
动 节点 (图 7-24 中 的 步骤 3)。 

仔细 地 思考 这 种 重新 路 由 选择 过 程 是 有 益 的 。 归 属 代理 需要 用 该 移动 节点 的 COA 来 
设置 数据 报 地 址 ， 以 便 网 络 层 将 数据 报 路 由 选择 到 外 部 网 络 。 在 另 一 方面 ， 需 要 保持 通信 
者 数据 报 的 原样 ， 因 为 接收 该 数据 报 的 应 用 程序 应 该 不 知道 该 数据 报 是 经 由 归属 代理 转发 
而 来 的 。 让 归属 代理 将 通信 者 的 原始 完整 数据 报 封装 (encapsulate) 在 一 个 新 的 ( 较 大 
的 ) 数据 报 中 ， 这 两 个 目标 都 可 以 得 到 满足 。 这 个 较 大 的 数据 报 被 导向 并 交付 到 移动 节点 
HJ COA, “HA” I% COA 的 外 部 代理 将 接收 并 拆 封 该 数据 报 ， 即 从 较 大 的 封装 数据 报 中 取 
出 通信 者 的 原始 数据 报 ， 然 后 再 向 移动 节点 转发 该 原始 数据 报 (图 7-24 中 的 步骤 3)。 
图 7-25 显 示 了 如 下 过 程 : 一 个 通信 者 向 归属 网 络 发 送 原始 数据 报 ; 向 外 部 代理 发 送 一 个 圭 
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装 的 数据 报 ; 以 及 向 移动 节点 交付 最 初 的 数据 报 。 思 维 敏锐 的 读者 将 会 注意 到 ， 这 里 描述 
的 封装 / 拆 封 概念 等 同 于 隧道 的 概念 ， 隧 道 是 在 4. 3 节 讨 论 正 多 播 与 IPv6 时 涉及 的 。 
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图 7-25 封装 与 拆 封 


接 下 来 我 们 考虑 某 移动 节点 如 何 向 一 个 通信 者 发 送 数据 报 。 这 相当 简单 ， 因 为 移动 节 
点 可 直接 将 其 数据 报 寻 址 到 通信 者 (使 用 自己 的 永久 地 址 作为 源 地 址 ， 通 信者 的 地 址 作为 
目的 地 址 ) 。 因 为 移动 节点 知道 通信 者 的 地 址 ， 所 以 没有 必要 通过 归属 代理 迁 回 传送 数据 
报 。 这 就 是 显示 在 图 7-24 中 的 步骤 4。 

下 面 通 过 列 出 支持 移动 性 所 需要 的 网 络 层 新 功能 ， 我 们 小 结 一 下 对 有 关 间 接 路 由 选择 
的 讨论 。 

O O 移动 节点 到 外 部 代理 的 协议 。 当 移动 节点 连接 到 外 部 网 络 时 ， 它 向 外 部 代理 注册 。 
类 似 地 ， 当 一 个 移动 节点 离开 该 外 部 网 络 时 ， 它 将 向 外 部 代理 取消 注册 。 
e 外 部 代理 到 归属 代理 的 注册 协议 。 外 部 代理 将 向 归属 代理 注册 移动 节点 的 COA, 
当 某 移动 节点 离开 其 网 络 时 ， 外 部 代理 不 需要 显 式 地 注销 COA， 因 为 当 移动 节点 
移动 到 一 个 新 网 络 时 ， 随 之 而 来 就 要 注册 一 个 新 的 COA， 这 将 完成 了 注销 。 

© 归属 代理 数据 报 封装 协议 。 将 通信 者 的 原始 数据 报 封装 在 一 个 目的 地 址 为 COA 的 

数据 报 内 ， 并 转发 之 。 

。 外 部 代理 拆 封 协 议 。 从 封装 好 的 数据 报 中 取出 通信 者 的 原始 数据 报 ， 然 后 再 将 该 

原始 数据 报 转发 给 移动 节点 。 

上 述 讨论 提供 了 一 个 移动 节点 在 网 络 之 间 移 动 时 要 维持 一 个 不 间断 的 连接 所 需 的 各 部 
分 : 外 部 代理 、 归 属 代理 和 间接 转发 。 举 一 个 例子 来 说 明 这 些 部 分 是 如 何 协同 工作 的 。 假 
设 某 移动 节点 连 到 外 部 网 络 A， 向 其 归属 代理 注册 了 网 络 A 中 的 一 个 COA， 并 且 正 在 接收 
通过 归属 代理 间接 路 由 而 来 的 数据 报 。 该 移动 节点 现在 移动 到 外 部 网 络 B 中 ， 并 向 网 络 B 
中 的 外 部 代理 注册 ， 外 部 代理 将 该 移动 节点 的 新 COA 告诉 了 其 归属 代理 。 此 后 ， 归 属 代 
理 将 数据 报 重 路 由 到 网 络 B。 就 一 个 通信 者 关心 的 东西 而 言 ， 移 动 性 是 透明 的 ， 即 在 移动 
前 后 ， 数 据 报 都 是 由 相同 的 归属 代理 进行 路 由 选择 。 就 归属 代理 关心 的 东西 而 言 ， 数 据 报 
流 没有 中 断 ， 即 到 达 的 数据 报 先是 转发 到 外 部 网 络 A; 改变 COA 后 ， 则 数据 报 转发 到 外 
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部 网 络 B。 但 当 移 动 节点 在 网 络 之 间 移 动 时 ， 它 会 看 到 数据 报 流 中 断 吗 ?只 要 移动 节点 与 
网 络 A 断 开 连接 (此 时 它 不 能 再 经 A 接收 数据 报 ) 再 连接 到 网 络 B (此 时 它 将 向 归属 代 
理 注册 一 个 新 的 COA) 用 的 时 间 少 ,那么 几乎 没有 丢失 数据 报 。 第 3 章 讲 过 ， 端 到 端 连 接 
可 能 会 由 于 网 络 拥塞 而 丢失 数据 报 。 因 而 当 一 个 节点 在 网 络 之 间 移动 时 ， 一 条 连接 中 的 数 
据 报 偶尔 丢失 算 不 上 什么 灾难 性 问题 。 如 果 需 要 进行 无 丢失 的 通信 ， 则 上 层 机 制 将 对 数据 
报 丢 失 进行 恢复 ， 不 管 这 种 丢失 是 因 网 络 拥塞 还 是 因 用 户 移动 而 引发 的 。 

在 移动 IP 标准 中 使 用 了 一 种 间接 路 由 选择 方法 [RFC 5944] ， 这 将 在 7.6 节 中 讨论 。 

2. 移动 节点 的 直接 路 由 选择 

在 图 7-24 中 阐述 了 间接 路 由 选择 方法 存在 一 个 低 效 的 问题 ， 即 三 角 路 由 选择 问题 
(triangle routing problem) 。 该 问题 是 指 即 使 在 通信 者 与 移动 节点 之 间 存 在 一 条 更 有 效 的 路 
由 ， 发 往 移动 节点 的 数据 报 也 要 先 发 给 归属 代理 ， 然 后 再 发 送 到 外 部 网 络 。 在 最 坏 情况 
下 ， 设 想 一 个 移动 用 户 正 在 访问 一 位 同行 所 在 的 外 部 网 络 ， 两 人 并 排 坐 在 一 起 且 正 在 通过 
网 络 交换 数据 。 从 通信 者 〈 在 该 例 中 为 该 访问 者 的 同行 ) 处 发 出 的 数据 报 被 路 由 选择 到 该 
移动 用 户 的 归属 代理 ， 然 后 再 回 到 该 外 部 网 络 ! 

直接 路 由 选择 (direct routing) 克服 了 三 角 路 由 选择 的 低 效 问题 ， 但 却 是 以 增加 复 
杂 性 为 代价 的 。 在 直接 路 由 选择 方法 中 ， 通 信者 所 在 网 络 中 的 一 个 通信 者 代理 (corre- 
spondent agent) 先知 道 该 移动 节点 的 COA。 这 可 以 通过 让 通信 者 代理 向 归属 代理 询问 得 
知 ， 这 里 假设 与 间接 路 由 选择 情况 类 似 ， 移 动 节点 具有 一 个 在 归属 代理 注册 过 的 最 新 的 
COA。 与 移动 节点 可 以 执行 外 部 代理 的 功能 相 类 似 ， 通 信者 本 身 也 可 能 执行 通信 者 代理 
的 功能 。 在 图 7-26 中 显示 为 步骤 1 和 步骤 2。 通 信者 代理 然后 将 数据 报 直接 通过 隧道 技 
术 发 往 移动 节点 的 COA， 这 与 归属 代理 使 用 的 隧道 技术 相 类 似 ， 参见 图 7-26 的 步骤 3 
和 步骤 4。 





图 7-26 到 某 移动 用 户 的 直接 路 由 选择 
尽管 直接 路 由 选择 克服 了 三 角 路 由 选择 问题 ， 但 它 引 入 了 两 个 重要 的 其 他 挑战 : 
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。 需要 一 个 移动 用 户 定位 协议 (mobile-user location protocol) ， 以 便 通 信者 代理 向 归 
属 代理 查询 获得 移动 节点 的 COA (图 7-26 中 的 步骤 1 和 步骤 2)。 

© 当 移 动 节点 从 一 个 外 部 网 络 移 到 另 一 个 外 部 网 络 时 ， 如 何 将 数据 报 转 发 到 新 的 外 
部 网 络 ? 在 间接 路 由 选择 的 情况 下 ， 这 个 问题 可 以 容易 地 通过 更 新 由 归属 代理 维 
持 的 COA 来 解决 。 然 而 ， 使 用 直接 路 由 选择 时 ， 归 属 代理 仅 在 会 话 开 始 时 被 通信 
者 代理 询问 一 次 COA。 因 此 ， 当 必要 时 在 归属 代理 中 更 新 COA， 这 并 不 足以 解决 
将 数据 路 由 选择 到 移动 节点 新 的 外 部 网 络 的 问题 。 

一 种 解决 方案 是 创建 一 个 新 的 协议 来 告知 通信 者 变化 后 的 COA。 另 一 种 方案 也 是 在 
GSM 网 络 实践 中 所 采用 的 方案 ， 它 的 工作 方式 如 下 。 假 设 数据 当前 正 转发 给 位 于 某 个 外 部 
网 络 中 的 移动 节点 ， 并 且 在 会 话 刚 开 始 时 该 移动 节点 就 位 于 该 网 络 中 (图 7-27 中 的 步骤 
1 ) 。 我 们 将 首次 发 现 移动 节点 的 外 部 网 络 中 的 外 部 代理 标识 为 锚 外 部 代理 (anchor foreign 
agent) 。 当 移动 节点 到 达 一 个 新 外 部 网 络 后 (图 7-27 中 的 步骤 2) ， 移 动 节点 向 新 的 外 部 
代理 注册 (步骤 3)， 并 且 新 外 部 代理 向 锚 外 部 代理 提供 移动 节点 的 新 COA (步骤 4)。 当 
锚 外 部 代理 收 到 一 个 发 往 已 经 离开 的 移动 节点 的 封装 数据 报 后 ， 它 可 以 使 用 新 的 COA 重 
新 封装 数据 报 并 将 其 转发 给 该 移动 节点 (步骤 5)。 如 果 移 动 节点 其 后 又 移 到 另 一 个 外 部 
网 络 中 ， 在 该 被 访 网 络 中 的 外 部 代理 随后 将 与 锚 外 部 代理 联系 ， 以 便 建 立 到 该 新 外 部 网 络 
的 转发 。 





图 7-27 在 网 络 间 使 用 直接 路 由 选择 的 移动 转移 


7.6 移动 IP 


支持 移动 性 的 因特网 体系 结构 与 协议 合 起 来 称 为 移动 ， 对 IPv4 主要 由 RFC 5944 定 
Mo 移动 全 是 一 个 灵活 的 标准 ， 支 持 许多 不 同 的 运行 模式 (例如 ， 具 有 或 不 具有 外 部 代 
理 的 运行 ) ， 代 理 与 移动 节点 相互 发 现 的 多 种 方式 ， 使 用 单个 或 多 个 COA， 以 及 多 种 形式 
的 封装 。 同 样 ， 移 动 下 是 一 个 复杂 的 标准 ， 需 要 用 整 本 书 才能 详细 描述 ; 的 确 有 这 样 一 
本 书 [Perkins 1998b] 。 这 里 ， 我 们 最 基本 的 目标 是 对 移动 IP 最 重要 的 部 分 进行 概述 ， 并 
说 明 它 在 一 些 常见 情形 中 的 使 用 。 
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移动 P 体系 结构 包含 了 许多 我 们 前 面 考 虑 过 的 要 素 ， 包括 归属 代理 、 外 部 代理 、 转 
交 地 址 和 封装 / 拆 封 等 概念 。 当 前 的 标准 [RFC 5944] 规定 到 移动 节点 使 用 间接 路 由 选择 
的 方法 。 

移动 PP 标准 由 三 部 分 组 成 : 

© 代理 发 现 。 移 动 全 定义 了 一 个 归属 代理 或 外 部 代理 用 来 向 移动 节点 通告 其 服务 的 

协议 ， 以 及 移动 节点 请 求 一 个 外 部 代理 或 归属 代理 的 服务 所 使 用 的 协议 。 

© 向 归属 代理 注册 。 移 动人 定义 了 移动 节点 和 /或 外 部 代理 向 一 个 移动 节点 的 归属 

代理 注册 或 注销 COA 所 使 用 的 协议 。 

© 数据 报 的 间接 路 由 选择 。 该 标准 也 定义 了 数据 报 被 一 个 归属 代理 转发 给 移动 节点 

的 方式 ， 包 括 转 发 数据 报 使 用 的 规则 、 处 理 差错 情况 的 规则 和 几 种 不 同 的 封装 形 
式 [RFC 2003; RFC 2004]. 

在 整个 移动 全 标准 中 安全 性 的 考虑 是 很 重要 的 。 例 如 ， 显 然 需要 对 一 个 移动 节点 进 
行 鉴别 以 确保 一 个 恶意 用 户 不 能 向 归属 代理 注册 一 个 伪造 的 转交 地 址 ， 伪 造 地 址 将 导致 所 
有 发 给 某 个 人 P 地 址 的 数据 报 被 重 定 向 到 恶意 用 户 。 移 动 IP 使 用 许多 机 制 来 实现 安全 性 ， 
我 们 将 在 第 8 章 考察 这 些 机 制 ， 在 以 下 的 讨论 中 将 不 考虑 安全 性 问题 。 

1. 代理 发 现 


到 达 一 个 新 网 络 的 某 移动 IP 节点 ,不管 是 连 到 一 个 外 部 网 络 还 是 返回 其 归属 网 络 ， 

它 都 必须 知道 相应 的 外 部 代理 或 归属 代理 的 身份 。 的 确 ， 这 是 新 外 部 代理 的 发 现 ， 通 过 一 

个 新 的 网 络 地 址 ， 才 使 移动 节点 中 的 网 络 层 知道 它 已 进入 一 个 新 的 外 部 网 络 。 这 个 过 程 被 

称 为 代理 发 现 (agent discovery) 。 代 理发 现 可 以 通过 下 列 两 种 方法 之 一 实现 : 经 代理 通告 

或 者 经 代理 请 求 。 
借助 于 代理 通告 〈agent advertisement) ， 外 部 代理 或 归属 代理 使 用 一 种 现 有 路 由 器 发 

现 协议 的 扩展 协议 [RFC 1256] 来 通告 其 服务 。 该 代理 周期 性 地 在 所 有 连接 的 链 路 上 广 

播 一 个 类 型 字段 为 9 〈 路 由 器 发 现 ) 的 ICMP 报 文 。 路 由 器 发 现 报 文 也 包含 路 由 器 ( 即 该 

代理 ) 的 他 地 址 ， 因 此 允许 一 个 移动 节点 知道 该 代理 的 他 地 址 。 路 由 器 发 现 报 文 还 包括 

了 一 个 移动 性 代理 通告 扩展 ， 其 中 包含 了 该 移动 节点 所 需 的 附加 信息 。 在 这 种 扩展 中 有 如 

下 一 些 较 重要 的 字段 ; 

e 归属 代理 比特 ( 昌 ) 。 指 出 该 代理 是 它 所 在 网 络 的 一 个 归属 代理 。 

外 部 代理 比特 (F) 。 指 出 该 代理 是 它 所 在 网 络 的 一 个 外 部 代理 。 

注册 要 求 比特 (R)。 指 出 在 该 网 络 中 的 某 个 移动 用 户 必须 向 某 个 外 部 代理 注册 。 

特别 是 ， 一 个 移动 用 户 不 能 在 外 部 网 络 ( 如 使 用 DHCP) 中 获得 一 个 转交 地 址 ， 

并 假定 由 它 自 己 承担 外 部 代理 的 功能 ,无须 向 外 部 代理 注册 。 

e M、G 封装 比特 。 指 出 除了 “IP Ay IP” (1P-in-IP) 封装 形式 外 ， 是 否 还 要 用 其 
他 的 封装 形式 。 

o 转交 地 址 (COA) 字段 。 由 外 部 代理 提供 的 一 个 或 多 个 转交 地 址 的 列表 。 在 下 面 
的 例子 中 ，COA 将 与 外 部 代理 关联 ， 外 部 代理 将 接收 发 给 该 COA 的 数据 报 ， 然 后 
再 转发 到 适当 的 移动 节点 。 移 动用 户 在 向 其 归属 代理 注册 时 将 选择 这 些 地 址 中 的 
一 个 作为 其 COA。 

图 7-28 说 明了 在 代理 通告 报 文 中 的 某 些 关键 字段 。 
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7-28 具有 移动 性 代理 通告 扩展 的 ICMP 路 由 器 发 现 报 文 


使 用 代理 请 求 (agent solicitation) ， 一 个 想 知道 代理 的 移动 节点 不 必 等 待 接收 代理 通 
告 ， 就 能 广播 一 个 代理 请 求 报 文 ， 该 报 文 只 是 一 个 类 型 值 为 10 的 ICMP 报 文 。 收 到 该 请 求 
的 代理 将 直接 向 该 移动 节点 单 播 一 个 代理 通告 ， 于 是 该 移动 节点 将 继续 处 理 ， 就 好 像 刚 收 
到 一 个 未 经 请 求 的 通告 一 样 。 

2. 向 归属 代理 注册 

一 且 某 个 移动 下 节点 收 到 一 个 COA， 则 该 地 址 必须 要 向 归属 代理 注册 。 这 可 通过 外 

部 代理 〈 由 它 向 归属 代理 注册 该 COA) 或 直接 通过 移动 PP 节点 自己 来 完成 。 我 们 下 面 考 
虑 前 一 种 情况 ， 共 涉及 4 个 步骤 。 
1) 当 收 到 一 个 外 部 代理 通告 后 ， 一 个 移动 节点 立即 向 外 部 代理 发 送 一 个 移动 也 注册 
报 文 。 注 册 报 文 承载 在 一 个 UDP 数据 报 中 并 通过 端口 434 发 送 。 注 册 报 文 携带 以 下 内 容 : 
一 个 由 外 部 代理 通告 的 COA、 归 属 代理 的 地 址 (HA) 、 移 动 节点 的 永久 地 址 (MA), W 
求 的 注册 寿命 和 一 个 64 比特 的 注册 标识 。 请 求 的 注册 寿命 指示 了 注册 有 效 的 秒 数 。 如 果 
注册 没有 在 规定 的 时 间 内 在 归属 代理 上 更 新 ,， 则 该 注册 将 变 得 无 效 。 注 册 标 识 就 像 一 个 序 
号 ， 用 于 收 到 的 注册 回答 与 注册 请 求 的 匹配 〈 下 面 会 讨论 ) 。 

2) 外 部 代理 收 到 注册 报 文 并 记录 移动 节点 的 永久 IP 地址。 外 部 代理 知道 现在 它 应 该 
查找 这 样 的 数据 报 ， 即 它 封 装 的 数据 报 的 目的 地 址 与 该 移动 节点 的 永久 地 址 相 匹配 。 外 部 
代理 然后 向 归属 代理 的 434 端口 发 送 一 个 移动 P 注册 报 文 (同样 封装 在 UDP 数据 报 中 ) 。 
这 一 报 文 包括 COA、HA 、MA 、 封 装 格式 要 求 、 请 求 的 注册 寿命 以 及 注册 标识 。 

3) 归属 代理 接收 注册 请 求 并 检查 真实 性 和 正确 性 。 归 属 代理 把 移动 节点 的 永久 了 P 地 
址 与 COA 绑 定 在 一 起 。 以 后 ， 到 达 该 归属 代理 的 数据 报 与 发 往 移动 节点 的 数据 报 将 被 封 
装 并 以 隧道 方式 给 COA。 归 属 代理 发 送 一 个 移动 卫 注册 回答 ， 该 响应 报 文 中 包含 有 HA, 
MA 、 实 际 注 册 寿 命 和 被 认可 的 请 求 报 文 注册 标识 。 

4) 外 部 代理 接收 注册 响应 ， 然 后 将 其 转发 给 移动 节点 。 

到 此 ， 注 册 便 完成 了 ， 移 动 节点 就 能 接收 发 送 到 其 永久 地 址 的 数据 报 。 图 7-29 说 明 
了 这 些 步骤。 注意 到 归属 代理 指定 的 寿命 比 移动 节点 请 求 的 寿命 要 小 。 
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被 访 网 络 
79.129.13/24 
移动 代理 
MA: 128.119.40.186 
归属 代理 外 部 代理 <> 
HA: 128.119.40.7 COA: 79.129.13.2 






ICMP 代 理 通告 


v 


+ 
时 间 | 时 间 时 间 
图 7-29 代理 通告 与 移动 卫 注册 


当 某 个 移动 节点 离开 其 网 络 时 ， 外 部 代理 无 须 显 式 地 取消 某 个 COA 的 注册 。 当 移动 
节点 移动 到 一 个 新 网 (不 管 是 另 一 个 外 部 网 络 还 是 其 归属 网 络 ) 并 注册 一 个 新 COA 时 ， 
上 述 情况 将 自动 发 生 。 

除了 上 面 所 描述 的 情况 ,移动 IP 标准 还 允许 许多 另外 的 情形 和 功能 ， 有 兴趣 的 读者 
可 以 参阅 [Perkins 1998b; RFC 5944], 


7.7 管理 蜂窝 网 中 的 移动 性 


分 析 了 P 网 络 中 的 移动 性 管理 以 后 ,我 们 现 将 注意 力 转 向 对 移动 性 支持 有 更 长 历史 
的 网 络 ， 即 蜂窝 电话 网 络 。 尽 管 在 7.4 节 中 我 们 关注 过 蜂窝 网 中 的 第 一 跳 无 线 链 路 ， 但 这 
里 我 们 关注 移动 性 ， 并 以 CSM 蜂窝 网 络 体系 结构 [Goodman 1997; Mouly 1992; Scourias 
2012; Kaaranen 2001; Korhonen 2003; Turner 2012] 作为 学 习 案 例 ， 因 为 它 是 一 个 成 熟 并 
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被 广泛 部 署 的 技术 。3G 和 49G 网 络 中 的 移动 性 原则 上 与 CSM 中 所 使 用 的 移动 性 类 似 。 与 
在 移动 IP 中 的 情况 类 似 ， 我 们 将 会 看 到 7. 5 节 指 出 的 许多 基本 原理 都 被 包含 在 CSM 网 络 
体系 结构 中 。 
与 移动 下 类 似 ，GSM 采用 了 一 种 间接 路 由 选择 方法 (参见 7. 5.2 节 )， 首 先 将 通信 者 
的 呼叫 路 由 选择 到 移动 节点 的 归属 网 络 ， 再 从 那 到 达 被 访 网 络 。 在 GSM 术语 中 ， 移 动用 
户 的 归属 网 络 被 称 作 该 移动 用 户 的 归属 公共 地 域 移动 网 络 (home Public Land Mobile 
Network, home PLMN) 。 由 于 首 字母 缩 略 词 PLMN 有 些 撩 口 ， 考 虑 到 我 们 避免 缩 略 词 字母 
表 的 要 求 ， 我 们 直接 将 GSM 归属 PLMN 称 为 归属 网 络 (home network ) 。 移 动用 户 向 某 个 
蜂窝 网 提供 商 订购 了 服务 ， 该 蜂窝 网 就 成 为 了 这 些 用 户 的 归属 网 络 ( 即 该 提供 商 就 按 月 提 
供 的 蜂窝 服务 收取 用 户 的 费用 ) 。 被 访问 的 PLMN， 我 们 直接 称 其 为 被 访 网 络 (visited 
network) ， 是 移动 用 户 当 前 所 在 网 络 。 
与 移动 IP 中 情况 类 似 ， 归 属 网 络 和 被 访 网 络 的 职责 有 很 大 的 差别 。 
。 归属 网 络 维护 一 个 称 作 归属 位 置 注册 器 (Home Location Register, HLR) 的 数据 
库 ， 其 中 包括 它 每 个 用 户 的 永久 蜂窝 电话 号 码 以 及 用 户 个 人 概要 信息 。 重 要 的 是 ， 
HLR 也 包括 这 些 用 户 当 前 的 位 置信 息 。 这 就 是 说 ， 如 果 一 个 移动 用 户 当 前 漫游 到 
另 一 个 提供 商 的 蜂窝 网 络 中 ，HLR 中 将 包含 足够 多 的 信息 来 获取 (通过 一 个 我 们 
即将 描述 的 过 程 ) 被 访 网 络 中 对 移动 用 户 的 呼叫 应 该 路 由 选择 到 的 地 址 。 我 们 将 
会 看 到 ， 当 一 个 呼叫 定位 到 一 个 移动 用 户 后 ， 通 信者 将 与 归属 网 络 中 一 个 被 称 作 
网 关 移 动 服务 交换 中 心 (Gateway Mobile services Switching Center, GMSC) 的 特殊 
交换 机 联系 。 同 样 ， 为 避免 擂 口 的 缩 略 词 ， 我 们 这 里 用 一 个 更 具 描 述 性 的 术语 来 
称呼 CMSC， 即 归属 MSC (home MSC) 。 
。 被 访 网 络 维护 一 个 称 作 访问 者 位 置 注 册 (Visitor Location Register, VLR) 的 数据 
Eo VLR 为 每 一 个 当前 在 其 服务 网 络 中 的 移动 用 户 包含 一 个 表 项 ，VLR 表 项 因此 
随 着 移动 用 户 进 入 和 离开 网 络 而 出 现 或 消失 。VLR 通常 与 移动 交换 中 心 (MSC ) 
在 一 起 ， 该 中 心 协调 到 达 或 离开 被 访 网 络 的 呼叫 建立 。 
在 实践 中 ， 一 个 服务 商 的 蜂窝 网 络 将 为 其 用 户 提供 归属 网 络 服务 ， 同 时 为 在 其 他 蜂窝 
服务 商 订购 服务 的 移动 用 户 提供 被 访 网 络 服务 。 


7.7.1 对 移动 用 户 呼叫 的 路 由 选择 


现在 我 们 描述 一 个 呼叫 如 何 定位 到 被 访 网 络 中 的 一 个 移动 GSM 用 户 。 我 们 首先 考虑 
下 面 一 个 简单 的 例子 ， 更 复杂 的 例子 在 [Mouly 1992] 中 有 描述 。 如 图 7-30 所 示 ， 这 些 步 
又 如 下 : 

1) 通信 者 拨打 移动 用 户 的 电话 号 码 。 该 号 码 本 身 并 不 涉及 一 个 特定 的 电话 线路 或 位 
置 (毕竟 电话 号 码 是 固定 的 ， 而 用 户 是 移动 的 ) ， 号 码 中 的 前 几 位 数字 是 以 全 局 地 判别 移 
动用 户 的 归属 网 络 。 呼 叫 从 通信 者 通过 公共 交换 电话 网 到 达 移 动用 户 归 属 网 络 中 的 归属 
MSC。 这 是 呼叫 的 第 一 步 。 

2) 归属 MSC 收 到 该 呼叫 并 查询 HLR 来 确定 移动 用 户 的 位 置 。 在 最 简单 的 情况 下 ， 
HLR 返回 移动 站 点 漫游 号 码 (Mobile Station Roaming Number，MSRN ) ， 我 们 称 其 为 漫游 号 
码 (roaming number) 。 注 意 到 这 个 号 码 与 移动 用 户 的 永久 电话 号 码 不 同 ， 后 者 是 与 移动 用 
户 的 归属 网 络 相关 联 的 ， 而 漫游 号 码 是 短暂 的 : 当 移 动用 户 进 入 一 个 被 访 网 络 后 ， 会 给 移 
动用 户 临 时 分 配 一 个 漫游 号 码 。 漫 游 号 码 的 作用 就 相当 于 移动 卫 中 转交 地 址 的 作用 。 并 
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且 ， 与 COA 类 似 ， 它 也 是 对 通信 者 和 移动 用 户 不 可 见 的 。 如 果 HLR 不 具有 该 漫游 号 码 ， 
它 返 回 被 访 网 络 中 VLR 的 地 址 。 在 这 种 情况 下 (未 在 图 7-30 中 显示 出 来 ) ， 归 属 MSC 需 
要 查询 VLR 以 便 获取 移动 节点 的 漫游 号 码 。 但 是 HLR 是 如 何 首 先 得 到 漫游 号 码 或 VLR 地 
址 的 呢 ? 移动 用 户 到 另 一 个 被 访 网 络 后 这 些 值 将 发 生 怎样 的 变化 ? 我 们 将 很 快 考虑 这 些 重 
要 问题 。 





图 7-30 将 呼叫 定位 到 一 个 移动 用 户 : 间接 路 由 选择 


3) 给 定 一 个 漫游 号 码 ， 归 属 MSC 通过 网 络 到 达 被 访 网 络 的 MSC 建立 呼叫 的 第 二 步 。 
至 此 ， 该 呼叫 已 经 完成 ， 从 通信 者 到 达 归 属 MSC， 再 从 归属 MSC 到 达 被 访 MSC， 然 后 到 
达 为 移动 用 户 提供 服务 的 基站 。 

在 第 二 步 中 ， 一 个 未 解决 的 问题 是 HLR 如 何 获得 有 关 移 动用 户 位 置 的 信息 。 当 一 个 
移动 电话 切换 或 进入 一 个 由 新 的 VLR 所 覆盖 的 被 访 网 络 中 以 后 ， 移 动用 户 必 须 向 被 访 网 
络 注册 ， 这 是 通过 在 移动 用 户 和 VLR 之 间 交 换 信 令 报 文 来 实现 的 。 被 访 VLR 随后 又 向 移 
动用 户 的 HLR 发 送 一 个 位 置 更 新 请 求 报 文 。 这 一 报 文告 知 HLR 可 以 用 来 联系 移动 用 户 的 
漫游 号 码 , 或 者 VLR 地 址 ( 它 可 以 用 来 随后 查询 以 获取 移动 号 码 ) 。 作 为 这 个 交换 的 一 部 
分 ，VLR 同样 从 HLR 那里 获取 移动 用 户 的 信 
息 ， 以 及 确定 被 访 网 络 应 该 给 予 移动 用 户 什 么 
样 的 服务 ( 如果 有 的 话 )。 


7.7.2 GSM 中 的 切换 


在 一 个 呼叫 过 程 中 ， 移 动 站 点 将 其 关联 从 
一 个 基站 改变 到 另 一 个 基站 时 出 现 切 换 (hand- 
off) 。 如 图 7-31 所 示 ， 移 动用 户 的 呼叫 初始 时 
(在 切换 前 ) 通过 一 个 基站 (我 们 称 其 为 旧 基 
站 ) 路 由 选择 到 该 移动 用 户 ， 而 在 切换 以 后 它 图 7-31 具有 一 个 公共 MSC 的 
经 过 另 一 个 基站 (我 们 称 其 为 新 基站 ) 路 由 选 基站 间 的 切换 情况 





旧 的 BS l 新 的 BS 
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择 到 移动 用 户 。 注 意 到 基站 之 间 的 切换 不 仅 导 致 移动 用 户 向 /从 一 个 新 的 基站 传输 /接收 信 
号 ,而 且 导致 正在 进行 的 呼叫 从 网 络 中 的 一 个 交换 点 到 新 基站 的 重 路 由 选择 。 我 们 首先 假 
设 新 旧 基 站 共享 同一 个 MSC， 并 且 重 路 由 选择 发 生 在 这 个 MSC。 

有 几 种 原因 导致 切换 的 发 生 ， 包 括 : 当前 基站 和 移动 用 户 之 间 的 信号 减弱 ， 使 得 该 
呼叫 有 被 中 断 的 危险 ;加 一 个 蜂 窒 处 理 的 呼叫 太 多 ， 变 得 过 载 。 可 以 通过 将 一 些 移动 用 户 
切换 到 邻近 不 太 拥塞 的 蜂窝 中 ， 使 这 个 拥塞 得 到 缓解 。 

在 与 一 个 基站 相关 联 期 间 ， 移 动用 户 周期 性 地 测量 来 自 其 当前 基站 和 临近 它 的 可 以 
“ 听 得 到 ”的 基站 的 信 标 信号 强度 。 这 些 测量 以 每 秒 1 ~2 次 的 频率 报告 给 移动 用 户 的 当前 
基站 。 根 据 这 些 测 量 值 、 临 近 蜂窝 的 移动 用 户 的 当前 负载 以 及 其 他 因素 ，GSM 中 的 切换 由 
旧 的 基站 发 起 [Mouly 1992] 。GSM 标准 并 未 明确 规定 基站 在 确定 是 否 进行 切换 时 所 采用 
的 具体 算法 。 

图 7-32 显示 了 当 一 个 基站 决定 切换 一 个 
移动 用 户 时 所 包括 的 步骤 : 

1) 旧 基 站 (BS) 通知 被 访问 MSC 即将 
要 进行 二 个 切换 ， 通 知 移动 用 户 将 要 切换 到 
的 BS (或 可 能 的 BS 集 ) 。 

2) 被 访问 MSC 发 起 建立 到 新 BS 的 路 
径 ， 分 配 承 载重 路 由 选择 的 呼叫 所 需 的 资源 ， 
以 及 用 信 令 告知 新 BS 一 个 切换 即将 出 现 。 

3) 新 BS 分 配 并 激活 一 个 无 线 信道 供 移 
动用 户 使 用 。 图 7-32 具有 一 个 公共 MSC 的 基站 间 

4) 新 BS 发 出 信 令 返回 被 访问 MSC ANIA 完成 一 个 切换 的 步骤 
BS， 即 已 经 建立 了 被 访问 MSC 到 新 BS 的 路 径 并 且 移动 用 户 应 当 被 告知 即将 发 生 的 切换 。 
新 BS 提供 移动 用 户 与 新 的 BS 相关 联 所 需要 的 所 有 信息 。 

5) 移动 用 户 被 告知 它 应 当 进 行 一 个 切换 。 注 意 到 此 时 为 止 ， 移 动用 户 完全 不 知 网 络 
已 经 为 切换 做 好 所 有 底层 工作 (如 在 新 BS 中 分 配 一 个 信道 ， 分 配 一 条 从 被 访问 MSC 到 新 
BS 的 路 径 ) 。 

6) 移动 用 户 和 新 BS 交换 一 个 或 多 个 报 文 ， 以 完全 激活 新 BS 中 新 的 信道 。 

7) 移动 用 户 向 新 BS 发 送 一 个 切换 完成 报 文 ， 该 报 文 随后 向 上 转发 给 被 访问 MSC, 
该 被 访问 MSC 然后 重 路 由 选择 到 移动 用 户 的 正在 进行 的 呼叫 ， 使 其 经 过 新 BS。 

8) 沿 着 到 旧 BS 的 路 径 分 配 的 资源 随后 被 释放 。 

通过 考虑 如 下 情况 来 总 结 我 们 对 切换 的 讨论 ， 当 移动 用 户 移动 到 一 个 不 同 于 旧 BS 的 、 
与 不 同 的 MSC 关联 的 BS 中 时 ， 并 且 当 这 种 MSC 之 间 的 切换 多 次 发 生 时 ， 考 虑 这 些 情况 下 
将 发 生 什么 。 如 图 7-33 所 示 ，GSM 定义 了 锚 MSC (anchor MSC) 的 概念 。 锚 MSC 是 呼叫 
首次 开始 时 移动 用 户 所 访问 的 MSC， 它 因此 在 整个 呼叫 持续 过 程 中 保持 不 变 。 在 整个 呼叫 
持续 期 间 ， 不 论 移动 用 户 进行 了 多 少 次 MSC 间 转 换 ， 呼 叫 总 是 从 归属 MSC 路 由 选择 到 错 
MSC， 然 后 再 到 移动 用 户 当前 所 在 的 被 访问 MSC。 当 移动 用 户 从 一 个 MSC 覆盖 区 到 达 另 
一 个 MSC 覆盖 区 后 ， 正 在 进行 的 呼叫 被 重 路 由 选择 ， 从 锚 MSC 到 包含 新 基站 的 新 被 访问 
MSC。 因 此 ， 在 任何 情况 下 ， 通 信者 和 移动 用 户 之 间 至 多 有 3 个 MSC (归属 MSC、 锚 MSC 
以 及 被 访问 MSC), 7-33 图 示 了 在 移动 用 户 所 访问 的 MSC 之 间 的 一 个 呼叫 的 路 由 选择 。 
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| a 
a) 切换 前 
图 7-33 通过 锚 MSC 重 路 由 选择 


另 一 种 方法 则 不 用 维持 从 锚 MSC 到 当前 MSC 的 单一 MSC 跳 ， 将 直接 链接 移动 用 户 访 
问 的 MSC, 每 当 移动 用 户 移 到 一 个 新 MSC 后 ， 让 旧 MSC 将 正在 进行 的 呼叫 转发 给 新 
MSC。 这 种 MSC 链 事实 上 能 够 出 现在 IS-41 蜂窝 网 络 中 ， 通 过 使 用 最 少 步骤 的 可 选 路 径 来 
去 除 在 锚 MSC 和 当前 访问 MSC 之 间 的 MSC [Lin 2001], 

下 面 通过 对 比 GSM 和 移动 卫 中 的 移动 性 管理 ， 来 完成 我 们 对 CSM 移动 性 管理 的 讨 
论 。 表 7-2 中 的 对 比 指出 了 尽管 他 和 蜂窝 网 络 在 很 多 方面 有 很 大 的 区 别 ， 但 它们 共享 数量 
惊人 的 公共 功能 要 素 和 处 理 移动 性 的 总 体 方法 。 





表 7-2 移动 IP 和 GSM 移动 性 之 间 的 共性 








对 GSM 要 素 的 解释 
移动 用 户 永久 电话 号 码 所 归属 的 网 络 


归属 MSC: 获取 移动 用 户 路 由 地 址 的 联系 点 。HLR 
归属 系统 中 包含 移动 用 户 永 久 电 话 号 码 、 个 人 信息 、 
当前 位 置 和 订购 信息 的 数据 库 


被 访问 系统 移动 用 户 当前 所 在 的 非 归属 系统 网 络 


被 访问 移动 (服务 ) 交换 中 心 或 简 被 访问 MSC: 负责 建立 与 MSC 相关 联 的 发 射 区 中 
称 被 访问 MSC, 访问 者 定位 记录 | 到 /从 移动 节点 的 呼叫 。VLR: 访问 系统 中 的 临时 数据 
(VLR) 库 项 ， 包 含 每 个 访问 移动 用 户 的 订购 信息 


用 于 归属 MSC 和 被 访问 MSC 之 间 电 话 呼叫 的 路 由 地 
址 ， 对 移动 用 户 和 通信 者 均 不 可 见 


7.8 无 线 和 移动 性 : 对 高 层 协议 的 影响 


在 本 章 中 ,我 们 已 经 看 到 了 无 线 网 络 在 链 路 层 〈 由 于 无 线 信道 的 诸如 衰减 、 多 径 、 隐 
终端 等 特性 ) 和 网 络 层 〈 由 于 移动 用 户 改变 与 网 络 的 连接 点 ) 与 有 线 网 络 的 对 应 物 有 重 
大 的 区 别 。 但 在 运输 层 和 应 用 层 是 否 也 有 重大 差别 呢 ? 我 们 很 容易 认为 这 些 差别 是 很 小 
的 ， 因 为 在 有 线 和 无 线 网 络 中 的 网 络 层 均 为 上 层 提供 了 同样 的 尽力 而 为 服务 模式 。 类 似 
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归属 系统 








网 关 移 动 (服务 ) 交换 中 心 或 简称 


归属 MSC， 归 属 位 置 注册 器 (HLR) ESYA 












外 部 代理 






移动 站 点 漫游 号 码 (MSRN ) ， 或 漫 
游 号 码 
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地 ， 如 果 在 有 线 和 无 线 网 络 中 都 是 使 用 诸如 TCP 和 UDP 的 协议 提供 运输 层 服 务 ， 那么 应 
用 层 也 应 该 保持 不 变 。 在 某 个 方面 我 们 的 直觉 是 对 的 ， 即 TCP 和 UDP 可 以 (也 确实 ) 运 
行 在 具有 无 线 链 路 的 网 络 中 。 在 另 一 方面 ， 运 输 层 协议 〈 特 别 是 TCP) 通常 在 有 线 和 无 线 
网 络 中 有 时 会 有 完全 不 同 的 性 能 。 这 里 ， 在 性 能 方面 区 别 是 明显 的 ， 我 们 来 研究 一 下 其 中 
的 原因 。 
前 面 讲 过 ， 在 发 送 方 和 接收 方 之 间 的 路 径 上 ， 一 个 报 文 段 不 论 是 丢失 还 是 出 错 ，TCP 
都 将 重 传 它 。 在 移动 用 户 情况 下 ， 丢 失 可 能 源 于 网 络 拥塞 (路 由 器 缓存 溢出 ) 或 者 切换 
(例如 ， 由 于 重 路 由 选择 报 文 段 到 移动 用 户 新 的 网 络 接 入 点 引入 的 时 延 )。 在 所 有 情况 下 ， 
TCP 的 接收 方 到 发 送 方 的 ACK 都 仅仅 表明 未 能 收 到 一 个 完整 的 报 文 段 ， 发 送 方 并 不 知道 
报 文 段 是 由 于 拥塞 ， 或 在 切换 过 程 中 ， 还 是 由 于 检测 到 比特 差错 而 被 丢弃 的 。 在 所 有 情况 
下 ， 发 送 方 的 反应 都 一 样 ， 即 重 传 该 报 文 段 。TCP 的 拥塞 控制 响应 在 所 有 场合 也 是 相同 
的 ， 即 TCP 减 小 其 拥塞 窗口 ， 如 3.7 节 讨论 的 那样 。 由 于 无 条 件 地 降低 其 拥塞 窗口 ，TCP 
隐 含 地 假设 报 文 段 丢失 是 由 于 拥塞 而 非 出 错 或 者 切换 所 致 。 我 们 在 7. 2 节 看 到 ， 在 无 线 网 
络 中 比特 错误 比 在 有 线 网 络 中 普遍 得 多 。 当 这 样 的 比特 差错 或 者 切换 丢失 发 生 时 ， 没 理由 
让 TCP 发 送 方 降低 其 拥塞 窗口 (并 因此 降低 发 送 速 率 )。 此 时 路 由 器 的 缓存 的 确 可 能 完全 
是 空 的 ， 分 组 可 以 在 端 到 端 链 路 中 丝毫 不 受 拥 塞 阻碍 地 流动 。 
研究 人 员 在 20 世纪 90 年 代 早 期 到 中 期 就 认识 到 ， 由 于 无 线 信 道 的 高 比特 差错 率 和 切 
换 丢 失 的 可 能 性 ，TCP 的 拥塞 控制 反应 在 无 线 情 况 下 可 能 会 有 问题 。 有 三 大 类 可 能 的 方法 
用 于 处 理 这 一 问题 : 
© 本 地 恢复 。 本 地 恢复 方法 的 目标 是 在 比特 差错 出 现 的 当时 和 当地 ( 如 在 无 线 链 路 
H) 将 其 恢复 。 如 在 7. 3 节 学 习 的 802. 11 ARQ 协议 , 或 者 使 用 ARQ 和 FEC 的 更 
为 复杂 的 方法 [ Ayanoglu 1995 ] ) 。 

© TCP 发 送 方 知晓 无 线 链 路 。 在 本 地 恢复 方法 中 ，TCP 发 送 方 完全 不 清楚 其 报 文 段 
跨越 一 段 无 线 链 路 。 另 一 种 方法 是 让 TCP 发 送 方 和 接收 方 知道 无 线 链 路 的 存在 ， 
从 而 将 在 有 线 网 络 中 发 生 的 拥塞 性 丢 包 和 在 无 线 网 络 中 发 生 的 差错 / 丢 包 区 分 开 ， 
并 且 仅 对 有 线 网 络 中 的 拥塞 性 丢 包 采用 拥塞 控制 。 在 假设 端 系统 能 够 做 出 这 种 区 
分 的 情况 下 ，[ Balakrishnan 1997] 详细 研究 了 多 种 类 型 的 TCP。[ Liu 2003] 研究 
了 在 一 个 端 到 端 路 径 中 区 分 有 线 部 分 丢 包 和 无 线 部 分 丢 包 的 技术 。 

e 分 离 连接 方法 。 在 分 离 连 接 方法 中 [Bakre 1995 ] ， 移 动用 户 和 其 他 端点 之 间 的 端 
到 端 连接 被 打 断 为 两 个 运输 层 连接 : 一 个 从 移动 主机 到 无 线 接 人 点 ， 一 个 从 无 线 
接 人 点 到 其 他 通信 端点 〈 我 们 假定 它 是 有 线 的 主机 ) 。 该 端 到 端 连 接 因此 是 由 一 个 
无 线 部 分 和 一 个 有 线 部 分 级 连 形成 的 。 经 无 线段 的 运输 层 能 够 是 一 个 标准 的 TCP 
连接 [Bakre 1995 ] ， 或 是 一 个 特别 定制 运行 在 UDP 上 的 差错 恢复 协议 。[ Yavatkar 
1994] 研究 了 经 无 线 连接 使 用 运输 层 选 择 性 重 传 协议 。 在 [Wei 2006] 中 的 测量 
报告 指出 了 分 离 TCP 连接 广泛 用 于 蜂 窒 数据 网 络 中 ， 通 过 使 用 分 离 TCP 连接 ， 上 
述 问题 的 确 能 够 有 很 大 改进 。 

我 们 这 里 有 关 无 线 链 路 上 的 TCP 的 讨论 是 十 分 简要 的 。 在 无 线 网 络 中 有 关 TCP 挑战 
和 解决 方案 的 深入 展望 能 够 在 [ Hanabali 2005; Leung 2006] 中 找到 。 我 们 鼓励 读者 去 查 
阅 这 些 文献 以 了 解 这 个 正在 进行 的 研究 领域 的 详情 。 

考虑 过 运输 层 协议 后 ， 我 们 接 下 来 考虑 无 线 和 移动 性 对 应 用 层 协 议 的 影响 。 这 里 一 个 
重要 的 考虑 是 无 线 链 路 经 常 具 有 相对 较 低 的 带宽 ， 如 我 们 在 图 7-2 中 所 见 。 因 此 ， 运 行 在 
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无 线 链 路 尤其 是 蜂窝 无 线 链 路 上 的 应 用 程序 ， 必 须 将 带宽 作为 稀有 物品 对 待 。 例 如 ， 一 个 
为 在 4G 电话 上 运行 的 Web 浏览 器 提供 服务 的 Web 服务 器 ， 就 不 能 像 为 运行 在 有 线 连接 的 
浏览 器 那样 提供 含有 大 量 图 片 的 内 容 。 尽 管 无 线 链 路 的 确 为 应 用 层 提出 一 些 挑战 ， 它 们 具 
有 的 移动 性 同样 使 得 一 大 批 位 置 知 晓 和 环境 知晓 应 用 成 为 可 能 [ Chen 2000; Baldauf 
2007] 。 更 一 般 地 ， 无 线 和 移动 网 络 将 在 未 来 的 泛 在 计算 环境 实现 中 起 着 重要 作用 [ Weis- 
er 1991 ] 。 显 然 ， 在 谈 及 无 线 和 移动 网 络 对 网 络 应 用 及 其 协议 的 影响 时 ， 公 平 而 论 我 们 仅 
看 到 了 冰山 一 角 ! 


7.9 小 结 


无 线 网 络 和 移动 网 络 使 电话 发 生 了 革命 性 变化 ， 同 时 也 对 计算 机 网 络 界 产 生 了 日 益 深 
远 的 影响 。 伴 随 着 它们 对 全 球 网 络 基础 设施 的 随时 、 随 地 、 无 缝 地 接 入 ， 它 们 不 仅 使 网 络 
接 人 变 得 更 加 无 所 不 在 ， 而 且 催生 了 一 组 新 的 、 令 人 兴奋 的 位 置 相关 服务 。 考 虑 到 无 线 网 
络 和 移动 网 络 不 断 增长 的 重要 性 ， 本 章 关 注 用 于 支持 无 线 和 移动 通信 的 原理 、 通 用 链 路 技 
术 以 及 网 络 体系 结构 。 

本 章 以 对 无 线 网 络 和 移动 网 络 的 介绍 开始 ， 描 述 了 由 这 种 网 络 中 通信 和 链 路 的 无 线 特性 
所 引发 的 挑战 和 由 这 些 无 线 链 路 带 来 的 移动 性 之 间 的 重要 区 别 。 这 使 我 们 能 够 更 好 地 区 
分 、 识 别 和 掌握 每 个 领域 中 的 关键 概念 。 我 们 首先 关注 无 线 通信 ， 在 7. 2 节 中 考虑 了 无 线 
链 路 的 特征 。 在 7.3 节 和 7.4 节 中 ， 我 们 研究 了 IEEE 802.11 (WiFi) 无 线 LAN 标准 、 两 
个 IEEE 802. 15 个 人 域 网 络 (蓝牙 和 ZigBee)， 以 及 3G 和 4G 蜂窝 因特网 接 人 。 然 后 我 们 
将 注意 力 转 向 移动 性 问题 。 在 7.5 节 中 我 们 区 分 了 多 种 形式 的 移动 性 ， 不 同 的 移动 性 面临 
不 同 的 挑战 ， 并 且 看 到 了 不 同 的 解决 方案 。 我 们 考虑 了 移动 节点 的 定位 和 路 由 选择 问题 ， 
以 及 对 那些 动态 地 从 一 个 网 络 接 入 点 移 到 男 一 个 网 络 接 入 点 的 移动 用 户 的 切换 问题 。 在 
7.6 节 和 7.7 节 中 ， 我 们 分 别 考察 了 这 些 问 题 在 移动 标准 和 CSM 中 是 如 何 处 理 的 。 最 
后 ,我 们 在 7. 8 节 中 考虑 了 无 线 链 路 和 移动 性 对 运输 层 协议 和 网 络 应 用 的 影响 。 

尽管 我 们 用 了 整整 一 章 来 学 习 无 线 网 络 和 移动 网 络 ， 但 全 面 探 索 这 个 令 人 兴奋 和 快速 
扩展 的 领域 需要 一 整 本 书 或 更 多 书 的 篇 幅 。 我 们 鼓励 读者 通过 查阅 在 本 章 中 提供 的 许多 参 
考 资料 ， 对 这 一 领域 进行 更 深入 的 研究 。 


课 后 习题 和 问题 





7.14% 

Rl. 一 个 无 线 网 络 运行 在 “基础 设施 模式 ”下 是 什么 含义 ? 如 果 某 网 络 没 有 运行 在 基础 设施 模式 下 ， 那 
么 它 运行 在 什么 模式 下 ? 这 种 运行 模式 与 基础 设施 模式 之 间 有 什么 不 同 ? 

R2. 在 7.1 节 的 分 类 法 中 ， 所 确定 的 四 种 无 线 网 络 类 型 各 是 什么 ?你 已 经 使 用 的 是 这 些 无 线 网 络 类 型 中 
的 哪 一 种 ? 

7.2% 

R3. 下 列 类 型 的 无 线 信道 损伤 之 间 有 什么 区 别 : 路 径 损耗 、 多 径 传播 、 来 自 其 他 源 的 干扰 ? 

R4. 随 着 移动 节点 离开 基站 越 来 越 远 ， 为 了 保证 传送 帧 的 丢失 概率 不 增加 ， 基 站 能 够 采取 的 两 种 措施 是 
什么 ? 
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描述 802. 11 中 信 标 帧 的 作用 。 
是 非 判 断 : 802. 11 站 在 传输 一 个 数据 帧 前 ， 必 须 首 先 发 送 一 个 RTS 帧 并 收 到 一 个 对 应 的 CTS 帧 。 
为 什么 802. 11 中 使 用 了 确认 ， 而 有 线 以 太 网 中 却 未 使 用 ? 
是 非 判 断 : 以 太 网 和 802. 11 使 用 相同 的 帧 格式 。 
描述 RTS 门限 值 的 工作 过 程 。 
假设 IEEE 802. 11 RTS 和 CTS 帧 与 标准 的 DATA 和 ACK 帧 一 样 长 ， 使 用 CTS 和 RTS 帧 还 会 有 好 处 
吗 ? 为 什么 ? 
7.3.4 节 讨论 了 802. 11 移动 性 ， 其 中 无 线 站 点 从 一 个 BSS 到 同一 子 网 中 的 另 一 个 BSS。 当 AP 是 通 
过 交换 机 互 连 时 ， 为 了 让 交换 机 能 适当 地 转发 帧 ， 一 个 AP 可 能 需要 发 送 一 个 带 有 哄骗 的 MAC 地 址 
的 帧 ， 为 什么 ? 
在 某 蓝牙 网 络 中 的 一 个 主 设备 和 在 802. 11 网 络 中 的 一 个 基站 之 间 有 什么 不 同 ? 
在 802. 15.4 ZigBee 标准 中 超级 帧 的 含义 是 什么 ? 
在 3G 蜂窝 数据 体系 结构 中 ,“ 核 心 网 ”的 作用 是 什么 ? 
在 3G 蜂窝 数据 体系 结构 中 ，RNC 的 作用 是 什么 ?在 蜂窝 语音 网 中 RNC 起 什么 作用 ? 
在 4G 体系 结构 中 eNodeB, MME, P-GW 和 S-GW 的 作用 是 什么 ? 
3G 和 4G 蜂窝 体系 结构 之 间 的 3 个 重要 差别 是 什么 ? 
~7.6 节 


R18. 如 果 某 节点 与 因特网 具有 无 线 连接 ， 则 该 节点 必定 是 移动 的 吗 ? 试 解释 之 。 假 设 一 个 使 用 膝 上 型 电 


R19. 


脑 的 用 户 携带 电脑 绕 着 她 的 住所 散步 ， 并 且 总 是 通过 相同 的 接 人 点 接 人 因特网 。 从 网 络 的 角度 看 ， 
这 是 移动 用 户 吗 ? 试 解释 之 。 
永久 地 址 与 转交 地 址 之 间 的 区 别 是 什么 ? 谁 指派 转交 地 址 ? 


R20. 考虑 经 移动 IP 的 一 条 TCP 连接 。 是 非 判断 : 在 通信 者 和 移动 主机 之 间 的 TCP 连接 阶段 经 过 该 移动 


7.7 


R21. 
R22. 


7.8 


R23. 


Pl. 


P4. 


用 户 的 归属 网 络 ， 但 数据 传输 阶段 直接 通过 该 通信 者 和 移动 主机 ， 绕 开 了 归属 网 络 。 
节 
在 GSM 网 络 中 ，HLR 和 VLR 的 目的 是 什么 ?移动 下 的 什么 要 素 类 似 于 HLR 和 VLR? 


在 GSM 网 络 中 ， 锚 MSC 的 作用 是 什么 ? 
节 
为 了 避免 单一 无 线 链 路 降低 一 条 端 到 端 运输 层 TCP 连接 的 性 能 ， 能 够 采取 的 三 种 方法 是 什么 ? 
习题 
考虑 在 图 7-5 中 单一 发 送 方 的 CDMA 例子 。 如 果 发 送 方 的 CDMA 码 是 (1, -1 ’ Ly “a iy Ls ’ 


1, 一 1) ， 那 么 其 输出 〈 对 于 所 显示 的 两 个 数据 比特 ) 是 什么 ? 


. 考虑 图 7-6 中 的 发 送 方 2， 发 送 方 对 信道 Z 的 输出 是 什么 〈 在 它 被 加 到 来 自发 送 方 1 的 信号 前 )? 
: 假设 在 图 7-6 中 的 接收 方 希望 接收 由 发 送 方 2 发 送 的 数据 。 说 明 通 过 使 用 发 送 方 2 的 代码 ， (经 计 


算 ) 接收 方 的 确 能 够 将 发 送 方 2 的 数据 从 聚合 信道 信号 中 恢复 出 来 。 ! 
在 两 个 发 送 方 、 两 个 接收 方 的 场合 ， 给 出 一 个 包括 1 和 -1 值 的 两 个 CDMA 编码 的 例子 ， 不 允许 两 个 
接收 方 从 两 个 CDMA 发 送 方 提 取出 初始 传输 的 比特 。 


. 假设 有 两 个 ISP 在 一 个 特定 的 咖啡 馆 内 提供 WiFi 接 人 ， 并 且 每 个 ISP 有 其 自己 的 AP 和 下 地 址 块 。 


a 进一步 假设 ,两 个 ISP 都 意外 地 将 其 AP 配置 运行 在 信道 11。 在 这 种 情况 下 ，802. 11 协议 是 否 将 
TERR? 讨论 一 下 当 两 个 各 自 与 不 同 ISP 相关 联 的 站 点 试图 同时 传输 时 ， 将 会 发 生 什么 情况 。 
b. 现在 假设 一 个 AP 运行 在 信道 1， 而 另 一 个 运行 在 信道 11。 你 的 答案 将 会 有 什么 变化 ? 


. 在 CSMA/CA 协议 的 第 4 步 , 一 个 成 功 传输 一 个 帧 的 站 点 在 第 2 步 (而 非 第 1 步 ) 开始 CSMA/CA 协 


议 。 通 过 不 让 这 样 一 个 站 点 立即 传输 第 2 个 帧 (如 果 侦 听 到 该 信道 空闲 ) CSMA/CA 的 设计 者 是 基 
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于 怎样 的 基本 原理 来 考虑 的 呢 ? 
P7. 假设 一 个 802. 11b 站 点 被 配置 为 始终 使 用 RTS/CTS 序列 预约 信道 。 假 设 该 节点 突然 要 发 送 1000 字 节 
的 数据 ， 并 且 所 有 其 他 站 点 此 时 都 是 空闲 的 。 作 为 SIFS 和 DIPS 的 函数 ， 并 忽略 传播 时 延 ， 假 设 无 比 

特 差错 ， 计 算 发 送 该 帧 和 收 到 确认 需要 的 时 间 。 

P8. 考虑 在 图 7-34 中 显示 的 情形 ， 其 中 有 4 个 无 线 节点 A、B、C 和 D。 这 4 个 节点 的 无 线 电 覆盖 范围 显 
示 为 其 中 的 椭圆 形 阴影 ; 所 有 节点 共享 相同 的 频率 。 当 A 传输 时 ， 仅 有 B 能 昕 到 /接收 到 ; B 传输 
时 ，A ALC 能 听 到 /接收 到 ; 当 C 传输 时 ，B 和 D 能 听 到 /接收 到 ; D 传输 时 ， 仅 有 C 能 听 到 / 
接收 到 。 

假定 现在 每 个 节点 都 有 无 限 多 的 报 文 要 向 每 个 其 他 节点 发 送 。 如 果 一 个 报 文 的 目的 地 不 是 近邻 ， 

则 该 报 文 必 须要 中 继 。 例 如 ， 如 果 A 要 向 DD RIK, RA A 的 报 文 必须 首先 发 往 B，B 再 将 该 报 文 发 

送 给 C，C 则 再 将 其 发 向 D。 时 间 是 分 隙 的 ， 报 文 所 用 的 传输 时 间 正 好 是 一 个 时 除 ， 如 在 时 隙 Aloha 

中 的 情况 一 样 。 在 一 个 时 隙 中 ， 节 点 能 够 做 下 列 工作 之 一 : (i) 发 送 一 个 报 文 (如 果 它 有 报 文 向 D 

FER); Gi) 接收 一 个 报 文 (如 果 正 好 一 个 报 文 要 向 它 发 送 ); (iii) 保持 静默 。 如 同 通常 情况 那样 ， 

如 果 一 个 节点 听 到 了 两 个 或 更 多 的 节点 同时 发 送 ， 出 现 冲突 ， 并 且 重 传 的 报 文 没 有 一 个 能 成 功 收 到 。 

你 这 时 能 够 假定 没有 比特 级 的 差错 ， 因 此 如 果 正 好 只 有 一 个 报 文 在 发 送 ， 它 将 被 位 于 发 送 方 传输 半 

径 之 内 的 站 点 正确 收 到 。 

a. 现在 假定 一 个 无 所 不 知 的 控制 器 〈 即 一 个 知道 在 网 络 中 每 个 节点 状态 的 控制 器 ) 能 够 命令 每 个 节 
点 去 做 它 〈 无 所 不 知 的 控制 器 ) 希望 做 的 事情 ， 例 如 发 送 报 文 ， 接 收报 文 ， 或 保持 静默 。 给 定 这 
种 无 所 不 知 的 控制 器 ， 数 据 报 文 能 够 从 C 到 A 传输 的 最 大 速率 是 什么 ， 假 定 在 任何 其 他 源 / 目 的 
地 对 之 间 没 有 其 他 报 文 ? 

b. 现在 假定 A 向 B 发 送 报 文 ， 并 且 D 向 C 发 送 报 文 。 数 据 报 文 能 够 从 A 到 B 且 从 D 到 C 流动 的 组 
合 最 大 速率 是 多 少 ? 

c 现在 假定 A 向 3 发 送 报 文 且 C 向 D 发 送 报 文 。 数 据 报 文 能 够 从 A 到 B 且 从 C 到 D 流动 的 组 合 最 
大 速率 是 多 少 ? 

d 现在 假定 无 线 链 路 由 有 线 链 路 代替 。 在 此 情况 下 ， 重 复 问 题 (a) ~ (e)s 

e 现在 假定 我 们 又 在 无 线 状态 下 ， 对 于 从 源 到 目的 地 的 每 个 数据 报 文 ， 目 的 地 将 向 源 回 送 一 个 ACK 
报 文 ( 例 如， 如同 在 TCP 中 ) 。 对 这 种 情况 重复 问题 (a) ~(ec)o 





图 7-34 习题 P8 的 情形 


PO. 描述 802. 15. 1 蓝牙 帧 的 格式 。 你 必须 要 阅读 某 些 课外 读物 来 获取 这 些 信息 。 在 帧 格式 中 有 哪些 因素 
本 质 上 会 限制 802. 15. 1 网 络 中 主动 节点 数量 为 8 呢 ? 试 解释 之 。 

P10. 考虑 下 列 理想 化 的 LTE 情形 。 下 行 信道 (参见 图 7-21) 划分 为 时 隙 ， 使 用 了 下 个 频率 。 有 4 个 节 
点 A、B、C 和 D 分 别 以 10Mbps、5Mbps、2. SMbps 和 1Mbps 速率 在 下 行 信道 上 可 到 达 基 站 。 这 些 速 
率 假定 基本 在 所 有 下 个 频率 上 能 够 利用 所 有 时 隙 只 疝 一 个 站 点 进行 发 送 。 基 站 具有 无 限量 的 数据 向 
每 个 节点 发 送 ， 并 且 在 下 行 子 帧 中 的 任何 时 隙 期 间 使 用 下 个 频率 中 的 任何 之 一 能 够 向 这 4 个 站 点 之 
一 发 送 。 
a 假定 基站 在 每 个 时 隙 期 间 能 够 向 它 选择 的 任何 节点 发 送 ， 它 能 向 节点 发 送 的 最 大 速率 是 多 少 ? 你 

的 解决 方案 公平 吗 ? 解释 并 定义 你 所 指 “ 公 平 ”的 含义 。 

b 如 果 有 公平 要 求 ， 即 每 个 站 点 在 每 秒 期 间 必 须 收 到 等 量 的 数据 ， 在 下 行 子 帧 期 间 基 站 (向 所 有 
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PL. 


P12. 


P13. 


P14. 


P15. 


P16. 





节点 ) 的 平均 传输 速率 是 多 少 ? 
o 假定 该 公平 性 准则 是 在 子 帧 期 间 任何 节点 至 多 能 够 接收 任何 其 他 节点 两 倍 多 的 数据 。 在 下 行 子 村 
期 间 基 站 (向 所 有 节点 ) 的 平均 传输 速率 是 多 少 ? 解释 你 是 如 何 得 到 答案 的 。 
在 7.5 节 ， 一 种 允许 移动 用 户 在 外 部 网 络 间 移 动 过 程 中 保持 其 卫 地 址 不 变 的 建议 方案 是 ， 让 外 部 网 
络 通告 一 个 到 该 移动 用 户 高 度 特 定 的 路 由 ， 并 使 用 现 有 的 路 由 选择 基础 设施 在 整个 网 络 中 传播 这 一 
信息 。 我 们 将 扩展 性 作为 一 种 关注 因素 。 假 设 移动 用 户 从 一 个 网 络 移动 到 另 一 个 网 络 后 ， 新 的 外 部 
网 络 通告 一 个 到 移动 用 户 的 特定 路 由 ， 旧 的 外 部 网 络 丢弃 其 路 由 。 考 虑 路 由 信息 如 何在 一 个 距离 向 
量 算法 中 传播 (尤其 是 对 于 跨越 全 球 的 网 络 间 的 域 间 路 由 选择 情况 ) 。 
a. 一 旦 外 部 网 络 开始 通告 其 路 由 ， 其 他 路 由 器 能 否 立 刻 将 数据 报 路 由 选择 到 新 的 外 部 网 络 呢 ? 
b. 不 同 的 路 由 器 有 可 能 认为 移动 用 户 位 于 不 同 的 外 部 网 络 中 吗 ? 
c 讨论 网 络 中 其 他 路 由 器 最 终 知道 到 达 移 动用 户 的 路 径 所 用 的 时 间 范 围 。 
假设 图 7-23 中 通信 者 是 移动 的 。 概 述 为 了 将 数据 报 从 初始 移动 用 户 路 由 选择 到 (现在 移动 的 ) 通 
信者 所 需要 的 额外 的 网 络 层 基础 设施 。 如 图 7-24 中 那样 ， 显 示 在 初始 移动 用 户 和 (现在 移动 的 ) 
通信 者 之 间 数 据 报 的 结构 。 
在 移动 PP 中 ， 移 动 性 将 对 数据 报 在 源 和 目的 地 间 的 端 到 端 时 延 有 怎样 的 影响 ? 
考虑 7:7.2 节 最 后 讨论 的 链 的 例子 。 假 设 一 个 移动 用 户 访问 外 部 网 络 A、B 和 C， 当 通信 者 在 外 部 
网 络 A 中 时 ， 它 开始 一 条 与 移动 用 户 的 连接 。 列 出 在 外 部 代理 之 间 和 外 部 代理 与 归属 代理 之 间 ， 当 
移动 用 户 从 网 络 A 到 网 络 B 再 到 网 络 C 的 过 程 中 的 报 文 序列 。 然 后 ， 假 设 未 执行 链接 ， 并 且 通 信者 
(以 及 归属 代理 ) 必须 被 显 式 地 告知 移动 用 户 转交 地 址 的 改变 。 列 出 在 第 二 种 情况 下 需要 交换 的 报 
文 序列 。 
考虑 在 一 个 具有 外 部 代理 的 外 部 网 络 中 的 两 个 移动 节点 。 在 移动 PP 中， 这 两 丫 移动 节点 是 否 可 能 
使 用 相同 的 转交 地 址 ? 解释 你 的 答案 。 
在 我 们 对 VLR 如 何 用 移动 用 户 当 前 位 置信 息 更 新 HLR 的 讨论 中 , 与 VLR 地 址 对 HLR 相 比 ， 提 供 
MSRN 所 具有 的 优 缺 点 各 是 什么 ? 


ei Wireshark 实验 


在 本 书 的 配套 Web 站 点 上 (http://www. pearsonhighered. com/cs- resources) ， 你 将 找到 有 关 本 章 的 一 


个 Wireshark 实验 ， 该 实验 用 于 捕获 和 学 习 在 无 线 便携 机 和 接 人 点 之 间 交 换 的 802. 11 Wi 
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。 请 描述 您 职业 生涯 中 干 过 的 几 个 最 令 人 激动 的 项 目 ? 

20 世纪 90 年 代 中 期 当 我 在 USC 和 ISI 的 时 候 ， 非 常 荣幸 地 与 像 Steve Deering, Mark Handley 和 Van 
Jacobson 这 样 的 人 物 在 一 起 工作 ， 设 计 多 播 路 由 选择 协议 (特别 是 PIM) 。 我 试图 将 多 播 体系 结构 设计 中 
的 许多 经 验 教训 借鉴 到 生态 监视 阵列 中 ， 这 是 我 首次 真正 开始 全 身心 地 进行 应 用 和 多 学 科 的 研究 。 那 让 
我 对 社会 和 技术 领域 中 的 联合 创新 感 兴趣 ,它们 激发 我 对 近期 的 研究 领域 一 一 移动 健康 的 研究 兴趣 。 这 
些 项 目 中 的 挑战 随 问题 领域 不 同 而 不 同 ， 但 它们 的 共同 之 处 是 需要 睁 大 我 们 的 眼睛 ， 当 我 们 在 设计 、 部 
署 、 制 作 原型 和 试用 之 间 重 复 时 关注 对 问题 的 定义 是 否 正确 。 没 有 一 个 问题 能 够 借助 于 模拟 或 者 构造 的 
实验 室 实 验 加 以 分 析 解 决 。 面 对 凌乱 的 问题 和 环境 要 保持 清晰 的 体系 结构 ， 它 们 都 对 我 们 的 能 力 提出 挑 
战 ， 并 且 它 们 都 需要 广泛 的 协作 。 

© 未 来 在 无 线 网 络 和 移动 性 方面 您 预见 将 会 发 生 什么 变化 和 创新 ? 

在 前 个 版 本 的 专访 中 曾 说 过 我 从 来 对 预测 未 来 不 具 太 多 信心 ， 但 我 的 确 继续 推测 ， 随 着 智能 手机 变 
得 越 来 越 强大 和 因特网 基本 接 入 点 增多 ,我们 可 能 看 到 特色 电话 ( 即 那 些 不 可 编程 和 仅 能 用 于 语音 和 文 
本 信息 的 电话 ) 的 终结 ， 并 且 很 快 在 今天 这 个 推测 显然 已 经 成 走 。 我 也 认为 我 们 将 看 到 艇 入 式 SIM 的 继 
续 迅 速 增长 ， 各 种 设备 通过 艇 人 式 SIM 经 过 蜂窝 网 络 能 够 以 低 数据 率 通 信 。 而 这 种 情况 已 出 现 ， 我 们 看 
到 许多 设备 和 “ 物 联 网 ” ， 它 们 使 用 嵌入 式 WiFi 和 其 他 低 功率 、 短 距离 以 及 各 种 形式 连接 到 本 地 中 心 。 
我 并 不 期 待 出 现 大 型 可 穿戴 消费 市 场 的 时 代 。 但 到 了 本 书 下 个 版 本 出 版 的 时 间 ， 我 期 待 着 在 物 联网 和 其 
他 数字 设备 数据 的 促进 下 ， 个 人 应 用 软件 会 有 极 大 的 增长 。 

。 您 预见 网 络 和 因特网 未 来 将 往 何 处 发 展 ? 

我 仍然 认为 向 后 看 和 向 前 看 是 有 用 的 。 以 前 我 观察 到 在 命名 数据 和 软件 定义 网 络 方面 的 努力 将 出 现 
成 果 ， 产 生 更 可 管理 、 可 演化 和 更 丰富 的 基础 设施 ， 并 且 更 一 般 地 表现 为 推动 体系 结构 的 角色 向 协议 栈 
较 高 层 发 展 。 在 因特网 初期 时 ， 体 系 结构 包括 第 四 层 及 以 下 ， 位 于 顶端 的 应 用 程序 更 为 竖井 式 / 独 块 式 。 
现在 则 是 数据 和 分 析 控 制 着 传输 。SDN 的 采用 已 经 超出 了 我 一 直 以 来 的 预期 在 本 书 的 第 7 版 中 包含 
SDN 的 内 容 使 我 由 训 地 感到 高 兴 。 然 而 ， 从 协议 栈 向 上 看 去 ,我 们 占 优势 的 应 用 越 来 越 多 地 生存 在 带 转 
墙 的 花园 之 中 ， 无论 是 移动 应 用 还 是 如 脸 书 那样 的 大 型 消费 者 平台 。 随 着 数据 科学 和 大 数据 技术 的 发 展 ， 
由 于 与 其 他 应 用 和 平台 连接 的 价值 ， 它 们 可 能 有 助 于 引导 这 些 应 用 跳出 藩 篇 。 

。 是 谁 激发 了 您 的 职业 灵感 ? 

有 三 个 人 出 现在 我 的 脑海 中 。 第 一 个 人 是 Dave Clark ， 他 是 因特网 界 的 秘方 和 无 名 英雄 。 早 期 我 有 幸 
在 他 的 左右 ， 看 到 他 在 IAB 的 组 织 规范 和 因特网 管理 方法 方面 所 起 的 作用 ， 成 为 大 致 共识 和 运行 编码 的 
引导 者 。 第 二 个 人 是 Seott Shenker， 他 的 智慧 才华 、 正 直 和 坚持 令 我 印象 深刻 。 我 努力 却 很 难 像 他 那样 清 
晰 地 定义 问题 和 给 出 解决 方案 。 无 论 问题 大 和 小 ， 我 发 电子 邮件 征求 建议 ， 他 总 是 第 一 个 回复 的 人 。 第 
三 个 人 是 我 的 姐姐 Judy Estrin， 她 将 创造 性 和 勇气 投入 到 她 的 职业 ， 将 想法 和 概念 带 入 市 场 。 没 有 
Judy 这 类 人 ， 因 特 网 技术 将 不 会 改变 我 们 的 生活 。 

© 您 对 进入 计算 机 科学 和 网 络 领 域 的 学 生 有 什么 忠告 ? 

首先 ， 在 你 的 学 术 工 作 中 构建 一 个 坚实 的 基础 ， 与 你 能 够 得 到 的 任何 、 每 个 现实 世界 的 工作 经 验 相 
权衡 。 当 你 寻找 一 个 工作 环境 时 ， 在 你 真正 关心 的 问题 领域 寻找 机 会 ， 并 且 参 与 到 你 能 够 从 中 学 习 的 思 
维 敏捷 的 团队 中 。 
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早 在 1.6 节 我 们 就 描述 了 某 些 非常 盛行 和 危险 的 因特网 攻击 ， 包 括 恶 意 软 件 攻 击 、 拒 
绝 服 务 、 嗅 探 、 源 伪装 以 及 报 文 修改 和 删除 。 尽 管 我 们 已 经 学 习 了 有 关 计 算 机 网 络 的 大 量 
知识 ， 但 仍然 没有 考察 如 何 使 网 络 安全 ， 使 其 免 受 那些 攻击 的 威胁 。 在 获得 了 新 的 计算 机 
网 络 和 因特网 协议 的 专业 知识 后 ， 我 们 现在 将 深入 学 习 安 全 通信 ， 特 别 是 计算 机 网 络 能 够 
防御 那些 令 人 厌恶 的 坏 家 伙 的 原理 。 

我 们 首先 介绍 一 下 Alice 和 Bob， 这 俩 人 要 进行 通信 ， 并 希望 该 通信 过 程 是 “安全 ” 
的 。 由 于 本 书 是 一 本 网 络 教 科 书 ， 因 此 Alice 和 Bob 可 以 是 两 台 需 要 安全 地 交换 路 由 选择 
表 的 路 由 器 ， 也 可 以 是 希望 建立 一 个 安全 传输 连接 的 客户 和 服务 器 ， 或 者 是 两 个 交换 安全 
电子 邮件 的 电子 邮件 应 用 程序 ， 所 有 这 些 学 习 案 例 都 是 在 本 章 后 面 我 们 要 考虑 的 。 总 之 ， 
Alice 和 Bob 是 安全 领域 中 两 个 众所周知 的 固定 设备 ， 也 许 因为 使 用 Alice 和 Bob 更 为 有 
趣 ， 这 与 命名 为 “A” 的 普通 实体 需要 安全 地 与 命名 为 “B” 的 普通 实体 进行 通信 的 作用 
是 一 样 的 。 需 要 安全 通信 的 例子 通常 包括 不 正当 的 情人 关系 、 战 时 通信 和 商业 事务 往来 ; 
我 们 宁愿 用 第 一 个 例子 而 不 用 后 两 个 例子 ， 并 使 用 Alice 和 Bob 作为 发 送 方 和 接收 方 ， 以 
第 一 种 情况 为 背景 来 讨论 问题 。 

我 们 说 过 Alice 和 Bob 要 进行 通信 并 希望 做 到 “安全 ”" ， 那 么 此 处 的 安全 其 确切 含义 是 
什么 呢 ? 如 我 们 将 看 到 的 那样 ， 安 全 性 ( 像 爱 一 样 ) 是 多 姿 多 彩 的 东西 ; 也 就 是 说 ， 安 全 
性 有 许多 方面 。 毫 无 疑问 ，Alice 和 Bob 希望 他 们 之 间 的 通信 内 容 对 于 窃听 者 是 保密 的 。 
他 们 可 能 也 想 要 确保 当 他 们 进行 通信 时 ,确实 是 在 和 对 方 通信 ， 还 希望 如 果 他 们 之 间 的 通 
信和 被 窃听 者 算 改 ， 他 们 能 够 检测 到 该 通信 已 被 算 改 破坏 。 在 本 章 的 第 一 部 分 ， 我们 将 讨论 
能 够 加 密 通 信 的 密码 技术 ， 鉴 别 正在 与 之 通信 的 对 方 并 确保 报 文 完整 性 。 

在 本 章 的 第 二 部 分 ， 我 们 将 研究 基本 的 密码 学 原则 怎样 用 于 生成 安全 的 网 络 协议 。 我 
们 再 次 采用 自 顶 向 下 方法 ， 从 应 用 层 开始 ， 逐 层 (上 面 四 层 ) 研究 安全 协议 。 我 们 将 研究 
如 何 加 密 电 子 邮 件 ， 如 何 加 密 一 条 TCP 连接 ， 如 何在 网 络 层 提供 覆盖 式 安 全 性 ， 以 及 如 何 
使 无 线 LAN 安全 。 在 本 章 的 第 三 部 分 ， 我 们 将 考虑 运行 的 安全 性 ， 这 与 保护 机 构 网 络 免 
受 攻击 有 关 。 特 别 是 ， 我 们 将 仔细 观察 防火 墙 和 入侵 检 测 系统 是 怎样 加 强 机 构 网 络 的 安全 
性 的 。 


8.1 什么 是 网 络 安全 


我 们 还 是 以 要 进行 “安全 ”通信 的 情人 Alice 和 Bob 为 例 ， 开 始 网 络 安全 的 研究 。 这 
确切 地 意味 着 什么 呢 ? 显然 ，Alice 希望 即使 他 们 在 一 个 不 安全 的 媒体 上 进行 通信 ， 也 只 
有 Bob 能 够 理解 她 所 发 送 的 报 文 ， 其 中 入 侵 者 (ARAZ Trudy) 能 够 在 该 媒体 上 截获 
从 Alice 向 Bob 传输 的 报 文 。Bob 也 需要 确保 从 Alice 接收 到 的 报 文 确实 是 由 Alice 所 发 送 
的 ， 并且 Alice 要 确保 和 她 进行 通信 的 人 的 确 就 是 Bob, Alice 和 Bob 还 要 确保 他 们 报 文 的 
内 容 在 传输 过 程 中 没有 被 算 改 。 他 们 首先 要 确信 能 够 通信 ( 即 无 人 拒绝 他 们 接 入 通信 所 需 


386 PEE 





的 资源 ) 。 考 虑 了 这 些 问 题 后 ， 我 们 能 够 指出 安全 通信 (secure communication) 具有 下 列 
所 需要 的 特性 。 
© 机 密 性 (confidentiality) 。 仅 有 发 送 方 和 和 希望 的 接收 方 能 够 理解 传输 报 文 的 内 容 。 
因为 窃听 者 可 以 截获 报 文 ， 这 必须 要 求 报 文 在 一 定 程度 上 进行 加 密 (encrypted), 
使 截取 的 报 文 无 法 被 截获 者 所 理解 。 机 密 性 的 这 个 方面 大 概 就 是 通常 意义 上 对 于 
术语 安全 通信 的 理解 。 我 们 将 在 8. 2 节 中 学 习 数 据 加 密 和 解密 的 密码 学 技术 。 
© 报 文 完整 性 〈message integrity), Alice 和 Bob 希望 确保 其 通信 的 内 容 在 传输 过 程 
中 未 被 改变 一 一 或 者 恶意 算 改 或 者 意外 改动 。 我 们 在 可 靠 传 输 和 数据 链 路 协议 中 
遇 到 的 检验 和 技术 在 扩展 后 能 够 用 于 提供 这 种 报 文 完整 性 ， 我 们 将 在 8.3 节 中 研 
究 该 主题 。 
e 端点 鉴别 (end-point authentication)。 发 送 方 和 接收 方 都 应 该 能 证 实 通信 过 程 所 涉及 
的 男 一 方 ， 以 确信 通信 的 另 一 方 确实 具有 其 所 声称 的 身份 。 人 类 的 面对面 通信 可 以 
通过 视觉 识别 轻易 地 解决 这 个 问题 。 当 通信 实体 在 不 能 看 到 对 方 的 媒体 上 交换 报 文 
时 ， 鉴 别 就 不 是 那么 简单 了 。 当 某 用 户 要 访问 一 个 邮箱 时 ， 邮 件 服务 器 如 何 证 实 该 
用 户 就 是 他 所 声称 的 那个 人 呢 ? 我 们 将 在 8. 4 节 中 学 习 端 点 鉴别 技术 。 
© 运行 安全 性 (operational security) 。 几 乎 所 有 的 机 构 (公司 、 大 学 等 ) 今天 都 有 了 
与 公共 因特网 相连 接 的 网 络 。 这 些 网 络 都 因此 潜在 地 能 够 被 危及 安全 。 攻 击 者 能 
够 试图 在 网 络 主机 中 安放 蠕虫 ， 获 取 公 司 秘密 ， 勘 察 内 部 网 络 配置 并 发 起 Dos 攻 
击 。 我 们 将 在 8. 9 节 中 看 到 诸如 防火 墙 和 入 侵 检测 系统 等 运行 设备 正 被 用 于 反 制 
对 机 构 网 络 的 攻击 。 防 火 墙 位 于 机 构 网 络 和 公共 网 络 之 间 ， 控 制 接 入 和 来 自 网 络 
的 分 组 。 人 侵 检 测 系 统 执行 “深度 分 组 检查 ”任务 ， 向 网 络 管理 员 发 出 有 关 可 疑 
活动 的 警告 。 
明确 了 我 们 所 指 的 网 络 安全 的 具体 含义 后 ， 接 下 来 考虑 人 侵 者 可 能 要 访问 的 到 底 是 哪 
些 信 息 ， 以 及 人 侵 者 可 能 采取 哪些 行动 。 图 8-1 阐述 了 一 种 情况 。Alice (发 送 方 ) 想 要 发 
送 数据 给 Bob (接收 方 ) 。 为 了 安全 地 交换 数据 ， 即 在 满足 机 密 性 、 端 点 鉴别 和 报 文 完整 
性 要 求 的 情况 下 ，Alice 和 Bob 交换 控制 报 文 和 数据 报 文 ( 以 非常 类 似 于 TCP 发 送 方 和 接 
收 方 双 方 交换 控制 报 文 和 数据 报 文 的 方式 进行 )。 通 常 将 这 些 报 文 全 部 或 部 分 加 密 。 如 在 
1.6 节 所 讨论 的 那样 ， 人 侵 者 能 够 潜在 地 执行 下 列 行为 : 
© 窃听 一 一 监听 并 记录 信道 上 传输 的 控制 报 文 和 数据 报 文 。 
© 修改 、 插 入 或 删除 报 文 或 报 文 内容 。 











Trudy 
8-1 发 送 方 、 接 收 方 和 入 侵 者 (Alice, Bob 和 Trudy) 
如 我 们 将 看 到 的 那样 ， 除 非 采取 适当 的 措施 ， 和 否则 上 述 能 力 使 人 侵 者 可 以 用 多 种 方式 
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发 动 各 种 各 样 的 安全 攻击 : AURA (可 能 窃取 口令 和 数据 ), 假冒 另 一 个 实体 ， 
“支持 ”一 个 正在 进行 的 会 话 ， 通 过 使 系统 资源 过 载 拒 绝 合法 网 络 用 户 的 服务 请 求 等 等 。 
CERT 协调 中 心 对 已 报道 的 攻击 进行 了 总 结 [CERT 2016] 。 

已 经 知道 在 因特网 中 某 处 的 确 存 在 真实 的 威胁 ， 则 Alice 和 Bob (两 个 需要 安全 通信 
的 朋友 ) 在 因特网 上 的 对 应 实体 是 什么 呢 ? 当然 ，Alice 和 Bob 可 以 是 位 于 两 个 端 系统 的 
人 类 用 户 ， 例 如 ， 真 实 的 Alice 和 真实 的 Bob 真 的 需要 交换 安全 电子 邮件 。 他 们 也 可 以 参 
与 电子 商务 事务 。 例 如 ， 真 实 的 Bob 希望 安全 地 向 一 台 Web 服务 器 传输 他 的 信用 卡号 码 ， 
以 在 线 购买 商品 。 类 似 地 ， 真 实 的 Alice 要 与 银行 在 线 交 互 。 需 要 安全 通信 的 各 方 自身 也 
可 能 是 网 络 基础 设施 的 一 部 分 。 前 面 讲 过 ， 域 名 系统 ( DNS， 参见 2.4 节 ) 或 交换 路 由 选 
择 信 息 的 路 由 选择 守护 程序 (参见 第 5 章 ) 需要 在 两 方 之 间 安 全 通信 。 对 于 网 络 管理 应 用 
也 有 相同 的 情况 ,第 5 章 讨论 了 该 主题 。 主 动 干扰 DNS 查找 和 更 新 (如 在 2.4 节 中 讨论 的 
那样 ) 、 路 由 选择 计算 [RFC 4272] 或 网 络 管理 功能 [RFC 3414] 的 人 侵 者 能 够 给 因特网 
造成 不 可 估量 的 破坏 。 

建立 了 上 述 框 架 ， 明确 了 一 些 重要 定义 以 及 网 络 安 全 需求 之 后 ， 我 们 将 深入 学 习 密 码 
学 。 应 用 密码 学 来 提供 机 密 性 是 不 言 而 喻 的 ， 同 时 我 们 很 快 将 看 到 它 对 于 提供 端点 鉴别 、 
报 文 完整 性 也 起 到 了 核心 作用 ， 这 使 得 密码 学 成 为 网 络 安 全 的 基石 。 


8.2 密码 学 的 原则 


尽管 密码 学 的 漫长 历史 可 以 追溯 到 朱利叶 斯 .凯撒 (Julius Caesar) 时 代 ， 但 现代 密 
码 技术 〈 包 括 今天 的 因特网 中 正在 应 用 的 许多 技术 ) 基于 过 去 30 年 所 取得 的 进展 。Kahn 
的 著作 《破译 者 (The Codebreakers)》( [Kahn 1967] 和 Singh 的 著作 《编码 技术 : 保密 
的 科学 一 一 从 古 埃 及 到 量子 密码 (The Code Book; The Science of Secrecy from Ancient Egypt 
to Quantum Cryptography)》 [Singh 1999 | 回顾 了 引人入胜 的 密码 学 的 悠久 历史 。 对 密码 学 
的 全 面 讨论 需要 一 本 完整 的 书 [Kaufman 1995; Schneier 1995], ， 所 以 我 们 只 能 初步 了 解密 
码 学 的 基本 方面 ， 特 别 是 因为 这 些 东西 正在 今天 的 因特网 上 发 挥 作用 。 我 们 也 注意 到 ， 尽 
管 本 节 的 重点 是 密码 学 在 机 密 性 方面 的 应 用 ， 但 我 们 将 很 快 看 到 密码 学 技术 与 鉴别 、 报 文 
完整 性 和 不 可 否认 性 等 是 紧密 相关 的 。 

密码 技术 使 得 发 送 方 可 以 伪装 数据 ， 使 入侵 者 不 能 从 截取 到 的 数据 中 获得 任何 信息 。 
当然 ， 接 收 方 必须 能 够 从 伪装 的 数据 中 恢复 出 初始 数据 。 图 8-2 说 明了 一 些 重要 的 术语 。 
my | 明文 





Alice Bob 
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现在 假设 Alice 要 向 Bob 发 送 一 个 报 文 。Alice 报 文 的 最 初 形式 (例如 ，“ Bob, I love 
you. Alice” ) 被 称 为 明文 (plaintext，cleartext) 。Alice 使 用 加 密 算法 (encryption algorithm) 
加 密 其 明文 报 文 ， 生 成 的 加 密 报 文 被 称 为 密 文 (ciphertext) ， 该 密 文 对 任何 人 侵 者 看 起 来 
是 不 可 懂 的 。 有 趣 的 是 在 许多 现代 密码 系统 中 ,包括 因特网 上 所 使 用 的 那些 ， 加 密 技 术 本 
身 是 已 知 的 ， 即 公开 发 行 的 、 标 准 化 的 和 任何 人 都 可 使 用 的 (例如 [RFC 1321; RFC 
3447; RFC 2420; NIST 2001]), ， 即 使 对 潜在 的 入 侵 者 也 是 如 此 ! 显然 ， 如 果 任 何人 都 知 
道 数 据 编 码 的 方法 ， 则 一 定 有 一 些 秘密 信息 可 以 阻止 人 侵 者 解密 被 传输 的 数据 。 这 些 秘密 
信息 就 是 密 钥 。 

在 图 8-2 中 ，Alice 提供 了 一 个 密 钥 (key) KK ， 它 是 一 串 数字 或 字符 ， 作 为 加 密 算 法 的 
输入 。 加 密 算法 以 密 钥 和 明文 报 文 m 为 输入 ， 生 成 的 密 文 作为 输出 。 用 符号 K,(m) 表示 
(使 用 密 钥 K, 加 密 的 ) 明文 报 文 m 的 密 文 形式 。 使 用 密 钥 K, 的 实际 加 密 算法 显然 与 上 下 文 
有 关 。 类 似 地 ，Bob 将 为 解密 算法 (decryption algorithm) 提供 密 钥 Ks， 将 密 文 和 Bob 的 密 
钥 作为 输入 ， 输 出 初始 明文 。 也 就 是 说 ， 如 果 Bob 接收 到 一 个 加 密 的 报 文 K(m) ， 他 可 通过 
计算 K,(K,(m) ) =m 进行 解密 。 在 对 称 密 钥 系统 (symmetric key system) 中 ，Alice 和 Bob 
的 密 钥 是 相同 的 并 且 是 秘密 的 。 在 公开 密 钥 系统 (public key system， 也 称 为 公 钥 系统 ) F, 
使 用 一 对 密 钥 : 一 个 密 钥 为 Bob 和 Alice (HASTA (实际 上 为 全 世界 所 知 ) ， 另 一 个 密 钥 只 有 - 
Bob 或 Alice 知道 (而 不 是 双方 都 知道 )。 在 下 面 两 小 节 中 ， 我 们 将 更 为 详细 地 考虑 对 称 密 钥 
系统 和 公 钥 系统 。 


8.2.1 ”对称 密 钥 密码 体制 


所 有 密码 算法 都 涉及 用 一 种 东西 替换 另 一 种 东西 的 思想 ， 例 如 ， 取 明文 的 一 部 分 进行 
计算 ， 替换 适当 的 密 文 以 生成 加 密 的 报 文 。 在 分 析 现 代 基 于 密 钥 的 密码 系统 之 前 ， 我 们 首 
先 学 习 一 下 凯撒 密码 (Caesar cipher) 找 找 感觉 这 是 一 种 加 密 数 据 的 方法 。 这 种 非常 古 
老 而 简单 的 对 称 密 钥 算 法 由 Julius Caesar 发 明 。 

凯撒 密码 用 于 英语 文本 时 ， 将 明文 报 文中 的 每 个 字母 用 字母 表 中 该 字母 后 第 上 个 字母 
进行 替换 Bal sale 即 把 字母 “a” 排 在 字母 “z” 之 后 ) 。 例 如 ， 如 果 上 =3， 则 明文 中 
的 字母 “a” 变 成 密 文 中 的 字母 “d”; 明文 中 的 字母 “b” 变 成 密 文中 的 字母 “e”， 依 此 
类 推 。 Baik, 上 的 值 就 作为 密 钥 。 举 一 个 例子 ， 明文 报 文 “bob，i love you. alice” 在 密 文 
HÆ “ere, l oryh brx. dolfh”。 尽 管 密 文 看 起 来 像 乱 码 ， 但 如 果 你 知道 使 用 了 凯撒 密码 
加 密 ， 因 为 密 钥 值 只 有 25 个 ， 所 以 用 不 了 多 久 就 可 以 破解 它 。 

凯撒 密码 的 一 种 改进 方法 是 单 码 代 替 密 码 ( monoalphabetic cipher) ， 也 是 使 用 字母 表 中 
的 一 个 字母 替换 该 字母 表 中 的 另 一 个 字母 。 然 而 ， 并 非 按照 规则 的 模式 进行 替换 (例如 ， 明 
文中 的 所 有 字母 都 用 偏 移 量 为 的 字母 进行 替换 ) ， 只 要 每 个 字母 都 有 一 个 唯一 的 替换 字母 ， 
任 一 字母 都 可 用 男 一 字母 替换 ， 反 之 亦 然 。 图 8-3 为 加 密 明文 的 一 种 可 行 替 换 规则 。 
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图 8-3 HPE 
明文 报 文 “bob，i love you. alice” 变 成 “nkn，s gkte wky. mgsbc”。 因 此 ， 与 用 凯撒 密 
码 情况 一 样 ， 这 看 起 来 像 乱码 。 单 码 代替 密码 的 性 能 看 来 要 比 凯 撒 密 码 的 性 能 好 得 多 ， 可 
能 的 字母 配对 为 26! (10“ 数 量 级 ) 种 ， 而 不 是 25 种。 尝试 所 有 10”“ 种 可 能 配对 的 蛮 力 法 
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要 求 的 工作 量 太 大 ， 不 是 一 种 破解 加 密 算法 和 解密 报 文 的 可 行 方式 。 但 是 ， 通 过 对 明文 语 
言 进 行 统 计 分 析 ， 例 如 ， 在 典型 的 英语 文本 中 ， 由 于 已 知 字母 “e” 和 字母 “t” 出 现 的 频 
率 较 高 (这 些 字 母 出 现 的 频率 分 别 为 13% 和 9%)， 并且 常见 的 两 三 个 字母 的 组 合 通常 一 
起 出 现 〈 例 如 ,“i”“it”“the”“ion”“ing” 等 等 ) ， 这 就 使 得 破解 该 密 文 变 得 相对 容 
易 。 如 果 入 侵 者 具有 某 些 该 报 文 的 可 能 内 容 的 知识 ， 则 破解 该 密码 就 会 更 为 容易 。 例 如 ， 
如 果 入 侵 者 Trudy 是 Bob 的 妻子 ,怀疑 Bob 和 Alice 有 了 上 暧昧 关系 ， 则 她 猜想 “bob” 和 
“alice” 这 些 名 字 可 能 会 出 现在 密 文中 。 如 果 Trudy 确信 这 两 个 名 字 出 现在 密 文 中 ， 并 有 
了 上 述 报 文 的 密 文 副本 ， 则 她 能 够 立即 决定 这 26 个 字母 配对 中 的 7 个 ， 比 蛮 力 法 少 检查 
10° 种 可 能 性 。 如 果 Trudy 的 确 怀疑 Bob 有 不 正当 的 男女 关系 ， 她 可 能 也 非常 期 待 从 该 报 
文中 找到 某 些 其 他 选择 的 词汇 。 
当 考 虑 Trudy 破解 Bob 和 Alice 之 间 加 密 方案 的 难 易 程 度 时 ， 可 以 根据 人 侵 者 所 拥有 
的 信息 分 为 三 种 不 同 的 情况 。 
。 唯 密 文 攻击 。 有 些 情况 下 ， 入 侵 者 只 能 得 到 截取 的 密 文 ， 也 不 了 解 明文 报 文 的 内 容 。 
我 们 已 经 看 到 ， 统 计 分 析 有 助 于 对 加 密 方案 的 唯 密 文 攻 击 (ciphertext-only attack), 
© 已 知 明文 攻击 。 前 面 已 经 看 到 ， 如 果 Trudy 以 某 种 方式 确信 在 密 文 报 文中 会 出 现 
“bob” 和 “alice”， 她 就 可 以 确定 字母 a、1、i、c、e、b Mo 的 (明文 ， 密 文 ) 
匹配 关系 。Trudy 也 可 能 会 幸运 地 记录 到 传输 的 所 有 密 文 ， 然 后 在 一 张 纸 上 找到 
Bob 写 下 的 已 解密 的 明文 。 当 入 侵 者 知道 (明文 ， 密 文 ) 的 一 些 匹配 时 ， 我 们 将 
其 称 为 对 加 密 方案 的 已 知 明 文 攻 击 (known-plaintext attack) 。 
e 选择 明文 攻击 。 在 选择 明文 攻击 (chosen-plaintext attack) 中 ， 人 和 人 侵 者 能 够 选择 某 
一 明文 报 文 并 得 到 该 明文 报 文 对 应 的 密 文 形式 。 对 于 我 们 前 面 所 说 的 简单 加 密 算 
法 来 说 ， 如 果 Trudy 能 让 Alice 发 送 报 文 “The quick brown fox jumps over the lazy 
dog”， 则 Trudy 就 能 够 完全 破解 Alice 和 Bob 所 使 用 的 加 密 方 案 。 但 是 随后 我 们 将 
看 到 ， 对 于 更 为 复杂 的 加 密 技术 来 说 ,使 用 选择 明文 攻击 不 一 定 意味 着 能 够 攻破 
该 加 密 机 制 。 
500 年 前 ， 发 明了 多 码 代 替 密 码 ( polyalphabetic encryption) ， 这 种 技术 是 对 单 码 代替 密 
码 的 改进 。 多 码 代替 密码 的 基本 思想 是 使 用 多 个 单 码 代替 密码 ， 一 个 单 码 代替 密码 用 于 加 密 
某 明 文 报 文中 一 个 特定 位 置 的 字母 。 因 此 ， 在 某 明文 报 文中 不 同位 置 出 现 的 相同 字母 可 能 以 
不 同 的 方式 编码 。 图 8-4 中 显示 了 多 码 代替 密码 机 制 的 一 个 例子 。 它 使 用 两 个 凯撒 密码 (其 
中 k=5 和 k=19)， 如 图 中 不 同 的 行 所 示 。 我 们 可 以 选择 使 用 这 两 个 凯撒 密码 C, AC, , ， 加 密 
时 采用 以 Gl CG, C,, Ci, C 的 次 序 循环 的 模式 ， 即 明文 的 第 一 个 字母 用 C, 编码 ， 第 二 和 
第 三 个 字母 用 C 编码 ， 第 四 个 字母 用 C, 编码 ， 第 五 个 字母 用 C 编码 ， 然 后 循环 重复 该 模 
式 ， 即 第 六 个 字母 用 C 编码 ， 第 七 个 字母 用 C, 编码 ， 依 此 类 推 。 这 样 一 来 ， 明 文 报 文 
“bob, i love you. ”加 密 后 成 为 “ghu，n etox dhz. ” 。 注 意 到 明文 报 文 中 的 第 一 个 “b” 用 C， 
MEN “g, BZA “b” HG 加 密 为 “u”。 在 这 个 例子 中 ， 加 密 和 解密“ 密 钥 ”是 两 个 
凯撒 密码 密 钥 (k=5 和 k=19) MC, CG, CG, Ci, C 的 次 序 模式 的 知识 。 
明文 字母 HE be ge somia a We gis 


C, (E5) :£ghijkimnopg dial 
C, (k=19) : stuvwxyzabcdefg Ty 









图 8-4 ”使 用 两 个 凯撒 密码 的 多 码 代替 密码 
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1. 块 密码 

我 们 现在 回 到 现代 社会 中 ， 考 察 对 称 密 钥 加 密 今天 的 工作 方式 。 对 称 加 密 技 术 有 两 种 
宽泛 的 类 型 : 流 密码 (stream cipher) 和 块 密码 (block cipher) 。 当 我 们 研究 无 线 LAN 的 
安全 性 时 ， 将 在 8.7 节 中 简要 地 研究 流 密码 。 在 本 节 中 ， 我 们 关注 块 密码 ， 该 密码 用 在 多 
种 因特网 协议 的 加 密 中 ,包括 PGP (用 于 安全 电子 邮件 ) 、SSL (用 于 使 TCP 连接 更 安全 ) 
和 IPsec (用 于 使 网 络 层 传 输 更 安全 ) 。 

在 块 密码 中 ， 要 加 密 的 报 文 被 处 理 为 比特 的 块 。 例 如 ， 如 果 上 =64， 则 报 文 被 划分 
为 64 比特 的 块 ， 每 块 被 独立 加 密 。 为 了 加 密 一 个 块 ， 该 密码 采用 了 一 对 一 映射 ,将 上 比 
特 块 的 明文 映射 为 比特 块 的 密 文 。 我 们 来 看 一 个 例子 。 假 设 k=3， 因 此 块 密码 将 3 比特 
HWA (AADC) 映射 为 3 比特 输出 ( 密 文 )。 表 8-1 给 出 了 一 种 可 能 的 映射 。 注 意 到 这 是 一 
个 一 对 一 的 映射 ， 即 对 每 种 输入 有 不 同 的 输出 。 这 种 块 密码 将 报 文 划分 成 3 比特 的 块 并 根 
据 映 射 关 系 进行 加 密 。 可 以 验证 ， 报 文 010110001111 被 加 密 成 了 101000111001, 


表 8-1 一 种 特定 的 3 比特 块 密码 

















继续 这 个 3 比特 块 的 例子 ， 注 意 到 上 述 映射 只 是 许多 可 能 映射 中 的 一 种 。 有 多 少 种 可 
能 的 映射 呢 ? 要 回答 这 个 问题 ,观察 到 一 个 映射 只 不 过 是 所 有 可 能 输入 的 排列 。 共 有 
2 ( =8) 种 可 能 的 输入 (排列 在 “输入 ” 栏 中 )。 这 8 种 输入 能 够 排列 为 8! = 40 320 种 不 
同方 式 。 因 为 这 些 排列 的 每 种 都 定义 了 一 种 映射 共有 40 320 种 可 能 的 映射 。 我 们 能 够 将 
这 些 映射 的 每 种 视 为 一 个 密 钥 ， 即 如 果 Alice 和 Bob 都 知道 该 映射 〈 密 钥 ) ， 他 们 能 够 加 密 
和 解密 在 他 们 之 间 发 送 的 报 文 。 

对 这 种 密码 的 蛮 力 攻击 即 通过 使 用 所 有 映射 来 尝试 解密 密 文 。 仅 使 用 40 320 种 映射 
( 当 k=3)， 这 能 够 在 一 台 桌 面 PC 上 迅速 完成 。 为 了 挫败 蛮 力 攻击 ， 块 密码 通常 使 用 大 得 
多 的 块 ， 由 64 比特 甚至 更 多 比特 组 成 。 注 意 到 对 于 通常 的 比特 块 密码 ， 可 能 映射 数量 
是 2"!1， 对 于 即使 不 大 的 值 (如 k=64)， 这 也 是 一 个 天 文 数字 。 

如 刚才 所 述 ， 尽 管 全 表 块 密码 对 于 不 大 的 大 值 能 够 产生 健壮 的 对 称 密 钥 加 密 方案 ， 但 
不 幸 的 是 它们 难以 实现 。 对 于 =64 和 给 定 的 映射 ， 将 要 求 Alice 和 Bob 维护 一 张 具 有 2” 
个 输入 值 的 表 ， 这 是 一 个 难以 实现 的 任务 。 此 外 ， 如 果 Alice 和 Bob 要 改变 密 钥 ,他 们 将 
不 得 不 每 人 重新 生成 该 表 。 因 此 ， 全 表 块 密码 在 所 有 输入 和 输出 之 间 提 供 了 预先 决定 的 映 
射 〈 如 在 上 述 例子 中 那样 ) ， 这 简直 是 不 可 能 实现 的 事 。 

取而代之 的 是 ， 块 密码 通常 使 用 函数 模拟 随机 排列 表 。 在 图 8-5 中 显示 了 当 k =64 时 
这 种 函数 的 一 个 例子 〈 引 自 [Kaufman 1995 ] ) 。 该 函数 首先 将 64 比特 块 划分 为 8 个 块 ， 
每 个 块 由 8 比特 组 成 。 每 个 8 比特 块 由 一 个 “8 比特 到 8 比特 ” 表 处 理 ， 这 是 个 可 管理 的 
长 度 。 例 如 ， 第 一 个 块 由 标志 为 Ti 的 表 来 处 理 。 接 下 来 ， 这 8 个 输出 块 被 重新 装配 成 一 
个 64 比特 的 块 。 该 输出 被 回馈 到 64 比特 的 输入 ， 开 始 了 第 二 次 循环 。 经 次 这 样 的 循环 
后 ， 该 函数 提供 了 一 个 64 比特 的 密 文 块 。 这 种 循环 的 目的 是 使 得 每 个 输入 比特 影响 最 后 
输出 比特 的 大 部 分 〈 即 使 不 是 全 部 ) 。 (如果 仅 使 用 一 次 循环 ， 一 个 给 定 的 输入 比特 将 仅 
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影响 64 输出 比特 中 的 8 比特 。) 这 种 块 密码 算法 的 密 钥 将 是 8 张 排列 表 〈 假 定 置 乱 函数 是 
公共 已 知 的 ) 。 





64 比 特 输入 


ew] [Bi] [Hee] [een] [oen] [our] [ou] [oe 
IOOOOOO® 
wos [mew] [ae] [es] [Weer] [cee] [nicer] [sw] [ice] 


64 比 特 置 乱 函 数 


| | 
SC 


图 8-5 一 个 块 密码 的 例子 


目前 有 一 些 流行 的 块 密码 ， 包括 DES (Data Encryption Standard， 数 据 加 密 标准 )、 
3DES 和 AES ( Advanced Encryption Standard, S AI BF ERME). ie He bp ME BB (HA T pw 
(而 不 是 预先 决定 的 表 ) ， 连 同 图 8-5 的 线 (虽然 对 每 种 密码 来 说 更 为 复杂 和 具体 )。 这 些 
算法 也 都 使 用 了 比特 串 作 为 密 钥 。 例 如 ，DES 使 用 了 具有 56 比特 密 钥 的 64 比特 块 。AES 
使 用 128 比特 块 ， 能 够 使 用 128, 192 和 256 比特 长 的 密 钥 进行 操作 。 一 个 算法 的 密 钥 决 
定 了 特定 “小 型 表 ” 映 射 和 该 算法 内 部 的 排列 。 对 这 些 密码 进行 蛮 力 攻击 要 循环 通过 所 有 
密 钥 ， 用 每 个 密 钥 应 用 解密 算法 。 观 察 到 采用 长 度 为 于 的 密 铀 ， 有 2" 种 可 能 的 密 钥 。 
NIST [NIST 2001] 估计 ， 如 果 用 1 秒 破解 56 比特 DES 的 计算 机 (就 是 说 ， 每 秒 尝试 所 有 
2™“ 个 密 钥 ) 来 破解 一 个 128 比特 的 AES 密 钥 ， 要 用 大 约 149 万 亿 年 的 时 间 才 有 可 能 成 功 。 

2. 密码 块 链接 


在 计算 机 网 络 应 用 中 ， 通 常 需要 加 密 长 报 文 (或 长 数据 流 ) 。 如 果 使 用 前 面 描述 的 块 
密码 ， 通 过 直接 将 报 文 切割 成 k 比特 块 并 独立 地 加 密 每 块 ， 将 出 现 一 个 微妙 而 重要 的 问 
题 。 为 了 理解 这 个 问题 ， 注 意 到 两 个 或 更 多 个 明文 块 可 能 是 相同 的 。 例 如 ， 两 个 或 更 多 块 
中 的 明文 可 能 是 “HTTP/1. 1”。 对 于 这 些 相同 的 块 ， 块 密码 当然 将 产生 相同 的 密 文 。 当 攻 
击 者 看 到 相同 的 密 文 块 时 ， 它 可 能 潜在 地 猜 出 其 明文 ， 并 且 通 过 识别 相同 的 密 文 块 和 利用 
支撑 协议 结构 的 知识 ， 甚 至 能 够 解密 整个 报 文 [Kaufman 1995 ] 。 

为 了 解决 这 个 问题 ， 可 以 在 密 文中 混合 某 些 随机 性 ， 使 得 相同 的 明文 块 产生 不 同 的 密 
文 块 。 为 了 解释 这 个 想法 , 令 m(i) 表示 第 i 个 明文 块 ，c(i) 表示 第 i 个 密 文 块 ， 并且 
a © "表示 两 个 比特 串 Ab 的 异 或 (XOR)。 (前 面 讲 过 0 四 0=1 四 1=0 和 0 由 1= 
1 申 0=1, 并 且 两 个 比特 串 的 异 或 是 逐 位 进行 的 。 例 如 10101010 ® 11110000 =01011010。) 
另外 ,将 具有 密 钥 S 的 块 密码 加 密 算法 表示 为 Ks。 其 基本 思想 如 下 : 发 送 方 为 第 i 块 生成 
一 个 随机 的 比特 数 r(i) ， 并 且 计算 c(i) =Ks(m(i) 旬 7(i) )。 注 意 到 每 块 选择 一 个 新 的 上 
比特 随机 数 。 则 发 送 方 发 送 c(1)、r(1)、c(2)、r(2)、c(3) 和 7(3) 等 等 。 因 为 接收 方 
接收 到 c(i) 和 7(i)， 它 能 够 通过 计算 m(i) =Ks(c(i) 旬 7(i)) 而 恢复 每 个 明文 块 。 重 要 
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的 是 注意 到 下 列 事实 : RE rG) 是 以 明文 发 送 的 ， 并 且 因 此 能 被 Trudy 嗅 探 到 ， 但 她 无 
法 获得 明文 m(i) ， 因 为 她 不 知道 密 钥 Ks;。 同 时 注意 到 如 果 两 个 明文 块 m(i) 和 m(j) 是 相 
同 的 ， 对 应 的 密 文 块 c(i) Alc(j) 将 是 不 同 的 (只 要 随机 数 r(i) 和 r(i) 不 同 ,， 这 种 情况 
出 现 的 概率 将 很 高 ) 。 

举例 来 说 ， 考 虑 表 8-1 中 的 3 比特 块 密码 。 假 设 明文 是 010010010。 如 果 Alice 直接 对 
此 加 密 ， 没 有 包括 随机 性 ， 得 到 的 密 文 变 为 101101101。 如 果 Trudy 嗅 探 到 该 密 文 AA 
这 三 个 密 文 块 都 是 相同 的 ， 她 能 够 正确 地 推断 出 这 三 个 明文 块 都 是 相同 的 。 现 在 假设 Al- 
ice 产生 了 随机 块 r(1) =001、r(2) =111 和 r(3) =100, 并 且 使 用 了 上 述 技术 来 生成 密 文 c 
(1) =100、c(2) =010 和 c(3) =000。 注 意 到 即使 明文 块 相 同 ， 三 个 密 文 块 也 是 不 同 的 。 
Alice 则 发 送 ce(1)、r(1)、c(2) 和 r(2) 。 读 者 可 证 实 Bob 能 够 使 用 共享 的 密 钥 Ks 获得 初 
始 的 明文 。 

精明 的 读者 将 注意 到 ， 引 入 随机 性 解决 了 一 个 问题 而 产生 了 另 一 个 问题 : Alice 必 
须 传输 以 前 两 倍 的 比特 。 实 际 上 ， 对 每 个 加 密 比 特 ， 她 现在 必须 再 发 送 一 个 随机 比特 ， 
使 需要 的 带宽 加 倍 。 为 了 有 效 利 用 该 技术 ， 块 密码 通常 使 用 了 一 种 称 为 密码 块 链接 
(Cipher Block Chaining，CBC) 的 技术 。 其 基本 思想 是 仅 随 第 一 个 报 文 发 送 一 个 随机 值 ， 
然后 让 发 送 方 和 接收 方 使 用 计算 的 编码 块 代替 后 继 的 随机 数 。 具 体 而 言 ，CBC 运行 过 程 
如 下 : 

1) 在 加 密 报 文 (或 数据 流 ) 之 前 ， 发 送 方 生成 一 个 随机 的 比特 串 ， 称 为 初始 向 量 
(Initialization Vector，IV) 。 将 该 初始 向 量 表示 为 c(0) 。 发 送 方 以 明文 方式 将 IV 发 送 给 接 
收 方 。 

2) 对 第 一 个 块 ， 发 送 方 计算 普 (1) 四 ec(0) ， 即 计算 第 一 块 明 文 与 IV 的 异 或 。 然 后 通 
过 块 密码 算法 运行 得 到 的 结果 以 得 到 对 应 的 密 文 块 ， 即 c(1) =K;(m(1) 申 c(0) )。 发 送 方 
向 接收 方 发 送 加 密 块 c(1)。 

3) 对 于 第 i 个 块 ， 发 送 方 根据 c(i) =Ks(m(i) 名 c(i-1)) 生成 第 i 个 密 文 块 。 

我 们 现在 来 考察 这 种 方法 的 某 些 后 果 。 首 先 ， 接 收 方 将 仍 能 够 恢复 初始 报 文 。 毫 无 疑 
问 ， 当 接收 方 接收 到 c(i) t, CH K, 解密 之 以 获得 5s(i) =m(i) 旬 c(i-1); 因为 接收 方 
已 经 知道 c(i-1), WA m(i) =s(i) 名 c(i-1) 获得 明文 块 。 第 二 ， 即 使 两 个 明文 块 是 相 
同 的 ， 相 应 的 密 文 块 也 ( 几乎) 总 是 不 同 的 。 第 三 ， 虽 然 发 送 方 以 明文 发 送 IV， 和 人 侵 者 
将 仍 不 能 解密 密 文 块 ， 因 为 该 人 侵 者 不 知道 秘密 密 钥 S。 最 后， 发 送 方 仅 发 送 一 个 最 前 面 
的 块 ( 即 IV)， 因 此 对 (由 数 百 块 组 成 的 ) 长 报 文 而 言 增加 的 带宽 用 量 微不足道 。 

举例 来 说 ， 对 表 8-1 中 的 3 比特 块 密码 ， 明 文 为 010010010 FIV =c(0) =001， 我 们 现在 
来 确定 其 密 文 。 发 送 方 首先 使 用 IV 来 计算 c(1) =Ks(m(1) 四 ec(0)) =100。 发 送 方 然后 计 
算 c(2)=Ks(m(2)@ c(1)) =K;(010 © 100) =000, 并且 e(3) =K;(m(3)® c(2)) = 
K,(010 ® 000) =101。 读者 可 证 实 接收 方 若 知道 了 IV 和 KK;， 将 能 够 恢复 初始 的 明文 。 

当 设 计 安 全 网 络 协议 时 ，CBC 有 一 种 重要 的 后 果 : 需要 在 协议 中 提供 一 种 机 制 ， 以 从 
发 送 方向 接收 方 分 发 IV。 在 本 章 稍 后 我 们 将 看 到 几 个 协议 是 如 何 这 样 做 的 。 


8.2.2 公开 密 钥 加 密 


从 凯撒 密码 时 代 直 到 20 世纪 70 年 代 的 两 千 多 年 以 来 ， 加 密 通 信 都 需要 通信 双方 共享 
一 个 共同 秘密 ， 即 用 于 加 密 和 解密 的 对 称 密 钥 。 这 种 方法 的 一 个 困难 是 两 方 必 须 就 共享 密 
钥 达 成 一 致 ， 但 是 这 样 做 的 前 提 是 需要 通信 (可 假定 是 安全 的 )! 可 能 是 双方 首先 会 面 ， 


HHEMAB PHBE 393 








人 为 协商 确定 密 钥 (例如 ,凯撒 的 两 个 百 夫 长 在 罗马 浴室 磁头 )， 此 后 才能 进行 加 密 通 信 。 
但 是 ,在 网 络 世 界 中 ,通信 各 方 之 间 可 能 从 未 见 过 面 ， 也 不 会 在 网 络 以 外 的 任何 地 方 交 
谈 。 此 时 通信 双方 能 够 在 没有 预先 商定 的 共享 密 钥 的 条 件 下 进行 加 密 通信 吗 ?1976 年 ， 
Diffie 和 Hellman [ Diffie 1976] 论证 了 一 个 解决 这 个 问题 的 算法 (现在 称 为 Diffie- Hellman 
密 钥 交换 ) ， 这 是 个 完全 不 同 、 极 为 优雅 的 安全 通信 算法 ,开创 了 如 今 的 公开 密 钥 密码 系 
统 的 发 展 之 路 。 我 们 很 快 就 会 看 到 公开 密 钥 密码 系统 也 有 许多 很 好 的 特性 ， 使 得 它 不 仅 可 
以 用 于 加 密 ， 还 可 以 用 于 鉴别 和 数字 签名 。 有 趣 的 是 ， 最 近 发 现 20 世纪 70 年 代 早期 由 英 
国 通信 电子 安全 团体 的 研究 人 员 独 立 研 究 的 一 系列 秘密 报告 中 的 思想 ， 与 [ Diffie 1976 ] 
和 [RSA 1978] 中 的 思想 类 似 [Elis 1987]。 事 实 常常 如 此 ， 伟 大 的 想法 通常 会 在 许多 地 
方 独立 地 闪现 ; 幸运 的 是 ， 公 钥 的 进展 不 仅 秘密 地 发 生 ， 而 且 也 在 公众 视野 中 发 生 。 

公开 密 钥 密码 的 使 用 在 概念 上 相当 简单 。 假 设 Alice 要 和 Bob 通信 。 如 图 8-6 所 示 ， 
这 时 Alice 和 Bob 并 未 共享 一 个 密 钥 (如 同 在 对 称 密 钥 系统 情况 下 ) mi Bob (Alice 报 文 
的 接收 方 ) 则 有 两 个 密 钥 ,一 个 是 世界 上 任何 人 (包括 入 侵 者 Trudy) 都 可 得 到 的 公 钥 
(public key) ， 另 一 个 是 只 有 Bob 知道 的 私 钥 (private key)。 我 们 使 用 符号 Ki 和 Ks 来 分 
别 表示 Bob 的 公 钥 和 私 钥 。 为 了 与 Bob 通信 ，Alice 首先 取得 Bob 的 公 钥 ,然后 用 这 个 公 
钥 和 一 个 众所周知 的 (例如 ， 已 标准 化 的 ) 加 密 算 法 ， 加 密 她 要 传递 给 Bob 的 报 文 m; B 
Alice 计算 Kj (m) Bob 接收 到 Alice 的 加 密 报 文 后 ， 用 其 私 钥 和 一 个 众所周知 的 (例如 ， 
已 标准 化 的 ) 解密 算法 解密 Alice 的 加 密 报 文 ， 即 Bob 计算 K; (Kz (m) ) 。 后 面 我 们 将 看 
到 ， 存 在 着 可 以 选择 公 钥 和 私 钥 的 加 密 / 解 密 算法 和 技术 ， 使 得 Ky (Ki (m)) =m; 也 就 是 
说 ， 用 Bob 的 公 钥 Ky 加 密 报 文 m (得 到 Kj (m))， 然 后 再 用 Bob 的 私 钥 Ks 解密 报 文 的 
密 文 形式 (就 是 计算 Ks (Kj (m) ) ) 就 能 得 到 最 初 的 明文 m。 这 是 个 不 寻常 的 结果 ! 用 这 
种 办 法 ，Alice 可 以 使 用 Bob 公开 可 用 的 密 钥 给 Bob 发 送 机 密 信息 ， 而 他 们 任 一 方 都 无 须 
分 发 任何 密 钥 ! 我 们 很 快 能 够 看 到 ， 公 钥 和 秘 钥 加 密 相互 交换 同样 能 够 得 到 不 寻常 的 结 
果 ， 即 Ks (Kg (m)) =K; (Kg (m)) =m, 


O= 局 公开 加 密 密 负 
| O= Ki FARRER 
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Al8-6 ”公开 密 钥 密码 


因此 公开 密 钥 密码 体制 的 使 用 在 概念 上 是 简单 的 。 但 是 有 两 点 必须 要 注意 。 首 先 应 关 
注 的 是 ， 尽 管 人 侵 者 截取 到 Alice 的 加 密 报 文 时 看 到 的 只 是 乱码 ,但 是 入 侵 者 知道 公 钠 
(显然 Bob 的 公 钥 是 全 世界 都 可 以 使 用 的 ) 和 Alice 加 密 所 用 的 算法 。Trudy 可 以 据 此 发 起 
选择 明文 攻击 ,使 用 已 知 的 标准 加 密 算法 和 Bob 的 公开 可 用 的 加 密 密 钥 对 她 所 选择 的 任意 
报 文 编码 ! 例如 ，Trudy 可 以 尝试 对 她 怀疑 Alice 可 能 发 送 的 全 部 报 文 或 部 分 报 文 编码 。 很 
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明显 ， 要 使 公开 密 钥 密码 能 工作 ， 密 钥 选择 和 加 密 /解密 算法 必须 保证 任意 入 侵 者 都 不 能 
(至 少 要 困难 得 几乎 不 可 能 ) 确定 出 Bob 的 私 钥 或 者 以 某 种 方式 解密 或 猜 出 Alice 发 给 Bob 
的 报 文 。 第 二 个 值得 关注 的 问题 是 ， 既 然 Bob 的 加 密 密 钥 是 公开 的 ， 任 何人 (包括 Alice 
和 其 他 声称 自己 是 Alice 的 人 ) 都 可 能 向 Bob 发 送 一 个 已 加 密 的 报 文 。 在 单一 共享 密 钥 情 
况 下 ， 发 送 方 知道 共享 秘密 密 钥 的 事实 就 已 经 向 接收 方 隐 含 地 证 实 了 发 送 方 的 身份 。 然 而 
在 公 钥 体制 中 ， 这 点 就 行 不 通 了 ， 因 为 任何 一 个 人 都 可 向 Bob 发 送 使 用 Bob 的 公开 可 用 密 
钥 加 密 的 报 文 。 这 就 需要 用 数字 签名 把 发 送 方 和 报 文 绑 定 起 来 ， 数 字 签 名 是 我 们 在 8.3 节 
中 讨论 的 主题 。 
1. RSA 


尽管 可 能 有 许多 算法 处 理 这 些 关注 的 问题 ， 但 RSA 算法 (RSA algorithm， 取 算法 创 
立 人 Ron Rivest, Adi Shamir 和 Leonard Adleman 的 首 字 母 命 名 ) 几乎 已 经 成 了 公开 密 钥 密 
码 的 代名词 。 我 们 首先 来 理解 RSA 是 如 何 工作 的 ， 然 后 再 考察 RSA 的 工作 原理 。 

RSA 广泛 地 使 用 了 模 算术 的 算术 运算 。 故 我 们 简要 地 回顾 一 下 模 算 术 。 前 面 讲 过 > 
mod n 只 是 表示 被 n 除 时 % 的 余数 ; 因此 如 19 mod 5 =4。 在 模 算术 中 ， 人 们 执行 通常 的 加 
法 、 乘 法 和 指数 运算 。 然 而 ， 每 个 运算 的 结果 由 整数 余数 代 蔡 ， 该 余数 是 被 n 除 后 留 下 的 
数 。 对 于 模 算 术 的 加 法 和 乘法 可 由 下 列 便于 施用 的 事实 所 简化 : 

[ (a mod n) + (b mod n) |mod n= (a+b)modn 

[ (a mod n) — (b mod n) |mod n= (a — b) mod n 

[ (a mod n) + (b mod n) |mod n= (a+ b)mod n 
从 第 三 个 事实 推出 (a mod n)’ mod n =a" mod ma， 我 们 很 快 将 会 发 现 这 个 恒等式 是 非常 有 
用 的 。 

现在 假设 Alice 要 向 Bob 发 送 一 个 RSA 加 密 的 报 文 ， 如 图 8-6 所 示 。 在 我 们 的 讨论 中 ， 
心中 永远 要 记 住 一 个 报 文 只 不 过 是 一 种 比特 模式 ， 并 且 所 有 比特 模式 能 唯一 地 被 一 个 整数 
(连同 该 比特 模式 的 长 度 ) 表示 。 例 如 ， 假 设 一 个 报 文 是 比特 模式 1001; 这 个 报 文 能 由 十 
进 制 整数 9 来 表示 。 所 以 ， 当 用 RSA 加 密 一 个 报 文 时 ， 等 价 于 加 密 表 示 该 报 文 的 这 个 唯一 
的 整数 。 

RSA 有 两 个 互相 关联 的 部 分 : 

© 公 钥 和 私 钥 的 选择 。 

。 加 密 和 解密 算法 。 

为 了 生成 RSA 的 公 钥 和 私 钥 ，Bob 执行 如 下 步骤 : 

1) 选择 两 个 大 素数 p 和 qo MA p 和 4 应 该 多 大 呢 ? 该 值 越 大 ， 破 解 RSA 越 困 难 ， 
而 执行 加 密 和 解密 所 用 的 时 间 也 越 长 。RSA 实验 室 推荐 ,公司 使 用 时 , p 和 4 的 乘积 为 
1024 比特 的 数量 级 。 对 于 选择 大 素数 的 方法 的 讨论 ， 参 见 [Caldwell 2012] 。 

2) HH n=pq Ailz=(p-1)(q-1). 

3) 选择 小 于 的 一 个 数 e， 且 使 和 z 没 有 ( 非 1 的) 公 因数 。 (这 时 称 e 与 z 互 
Ro) 使 用 字母 e 表示 是 因为 这 个 值 将 被 用 于 加 密 。 

4) 求 一 个 数 4， 使 得 ed -1 可 以 被 z 整除 (就 是 说 ,没有 余数 )。 使 用 字母 d 表示 是 
因为 这 个 值 将 用 于 解密 。 换 句 话说 ， 给 定 e， 我们 选择 4， 使 得 

ed mod z = 1 


5) Bob 使 外 界 可 用 的 公 钥 Ks 是 一 对 数 (n, e), HAM Ks 是 一 对 数 (n, d)o 
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Alice 执行 的 加 密 和 Bob 进行 的 解密 过 程 如 下 : 
© 假设 Alice 要 给 Bob 发 送 一 个 由 整数 m 表示 的 比特 组 合 ， 且 m <n。 为 了 进行 编码 ， 
Alice 执行 指数 运算 m, AA m thr 除 的 整数 余数 。 换 言 之 ，Alice 的 明文 报 
X m 的 加 密 值 < 就 是 : 
c = mmodn 
对 应 于 这 个 密 文 c 的 比特 模式 发 送 给 Bobo 
© 为 了 对 收 到 的 密 文 报 文 c< R, Bob 计算 : 
m = cd mod n 
这 要 求 使 用 他 的 私 钥 (n, d)o 
举 一 个 简单 的 RSA 例子 ,假设 Bob 选择 p=5 和 9g =7。( 坦 率 地 讲 ， 这 样 小 的 值 无 法 
保证 安全 。) 则 n=35 和 z=24。 因 为 5 和 24 没有 公 因 数 ， 所 以 Bob 选择 e=5。 最 后 ， 因 
为 5x29-1 ( 即 ed -1) 可 以 被 24 HBR, ATLA Bob 选择 d=29。Bob AF T n=35 和 e=5 
这 两 个 值 ， 并 秘密 保存 了 d=29。 观 察 公开 的 这 两 个 值 ， 假 定 Alice 要 发 送 字 母 “1”“o” 
“v” 和 “e” 给 Bob。 用 1~26 之 间 的 每 个 数 表示 一 个 字母 ， 其 中 1 表示 “a”,…，26 表 
示 “z”，Alice 和 Bob 分 别 执行 如 表 8-2 MÆ 8-3 所 示 的 加 密 和 解密 运算 。 注 意 到 在 这 个 例 
子 中 ,我 们 认为 每 四 个 字母 作为 一 个 不 同 报 文 。 一 个 更 为 真实 的 例子 是 把 这 四 个 字母 转换 
成 它们 的 8 比特 ASCI 表示 形式 ， 然 后 加 密 与 得 到 的 32 比特 的 比特 模式 对 应 的 整数 。( 这 
样 一 个 真实 的 例子 产生 了 一 些 长 得 难以 在 教科 书 中 打印 出 来 的 数 !) 


表 8-2 Alice 的 RSA 加密，e =5，n=35 












248832 
759375 











481968572106750915091411825223071697 
12783403948858939111232757568359375 


851643319086537701956194499721106030592 aa DEN 


100000000000000000000000000000 











BEK 8-2 和 表 8-3 中 的 简单 示例 已 经 产生 了 某 些 极 大 的 数 ， 并 且 假 定 我 们 前 面 看 到 
p All q 都 是 数 百 比特 长 的 数 ， 这 些 都 是 实际 使 用 RSA 时 必须 要 牢记 的 。 如 何 选择 大 素数 ? 
如 何 选 择 e 和 d? 如 何 对 大 数 进行 指数 运算 ? 对 这 些 重 要 问题 的 详细 讨论 超出 了 本 书 的 范 
围 ， 详 情 请 参见 [Kaufman 1995] 以 及 其 中 的 参考 文献 。 

2. BAB 


这 里 我 们 注意 到 ，RSA 所 要 求 的 指数 运算 是 相当 耗费 时 间 的 过 程 。 形 成 对 比 的 是 ， 
DES 用 软件 实现 要 比 RSA 快 100 倍 ， 用 硬件 实现 则 要 快 1000 ~ 10 000 ff [RSA Fast 
2012] 。 所 以 ， 在 实际 应 用 中 ，RSA 通常 与 对 称 密 钥 密 码 结 合 起 来 使 用 。 例 如 ， 如 果 Alice 
要 向 Bob 发 送 大 量 的 加 密 数 据 ， 她 可 以 用 下 述 方式 来 做 。 首 先 ，Alice 选择 一 个 用 于 加 密 
数据 本 身 的 密 钥 ， 这 个 密 钥 有 时 称 为 会 话 密 钥 (session key) ， 该 会 话 密 钥 表 示 为 Kso 
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Alice 必须 把 这 个 会 话 密 钥 告知 Bob， 因 为 这 是 他 们 在 对 称 密 钥 密码 (W DES E AES) 中 
所 使 用 的 共享 对 称 密 钥 。Alice 可 以 使 用 Bob 的 RSA 公 钥 来 加 密 该 会 话 密 铀 ， 即 计算 c = 
(Ks) mod no Bob 收 到 了 该 RSA 加 密 的 会 话 密 钥 后 ， 解 密 得 到 会 话 密 钥 K,. Bob 此 时 已 
经 知道 Alice 将 要 用 于 加 密 数据 传输 的 会 话 密 钥 了 。 

3，RSA 的 工作 原理 


RSA 加 密 / 解 密 看 起 来 相当 神奇 。 为 什么 那样 应 用 加 密 算 法 ， 然 后 再 运行 解密 算法 ， 
就 能 恢复 出 初始 报 文 呢 ? 要 理解 RSA 的 工作 原理 ， 我 们 仍 将 记 =pg， 其 中 p Fil q 是 RSA 
算法 中 的 大 素数 。 
前 面 讲 过 ， 在 RSA 加 密 过 程 中 ， 一 个 报 文 m〔 唯 一 地 表示 为 整数 ) EHE n RRI e 
wee, BI 
c =m‘ mod n 
解密 则 先 对 该 值 执 行 d 次 宕 运算 ， 再 做 模 半 运算 。 因 此 先 加 密 再 解密 的 结果 是 (m 
mod n)’ mod n。 下 面 我 们 来 看 关于 这 个 量 能 够 得 到 什么 。 正 如 前 面 提 到 的 ， 模 算术 的 一 个 
重要 性 质 是 对 于 任意 值 a、n 和 d 都 有 (a mod n)* mod n=a* mod n。 因 此， 在 这 个 性 质 中 
使 用 a=m ， 则 有 
| (m° mod n)’ mod n = m“ mod n i 
因此 剩 下 证 明 m” mod n=m, REFFR TIER RSA 工作 原理 的 神秘 面纱 ,但 为 了 
做 到 这 一 点 ， 我 们 还 需要 用 到 数论 中 一 个 相当 神奇 的 结果 。 具 体 而 言 ， 就 是 要 用 到 数论 中 
这 样 的 结论 : WE p 和 9g BRA, AA n=pq 和 z=(p-1)(g-1), Wa mod nn 与 4 
mod n 是 等 同 的 【Kaufman 1995 ] 。 应 用 这 个 结论 ， 对 于 x=m 和 y=ed， 可 得 
m“ mod n = m‘“"™"? mod n 
但 是 要 记 住 ， 我 们 是 这 样 选 择 e Ald HY, Bled mod z =1。 这 告诉 我 们 
mmodm = m' mod n =m 
这 正 是 我 们 希望 得 到 的 结果 ! 先 对 m he KREZA (mA) 再 做 4 KREZA ( 解 
密 ) ， 然 后 做 模 nn 的 算术 运算 (原文 中 没有 这 句 ， 译 者 认为 有 必要 补 上 。 一 一 译 者 注 ) ， 
就 可 得 到 初始 的 普 。 甚 至 更 为 奇妙 之 处 是 这 样 一 个 事实 ， 如 果 我 们 先 对 严 做 4 次 寡 运 算 
(加 密 ) 再 做 e 次 过 运算 ， 即 颠倒 加 密 和 解密 的 次 序 ， 先 执行 解密 操作 再 执行 加 密 操 作 ， 
也 能 得 到 初始 值 m。 这 个 奇妙 的 结果 完全 遵循 下 列 模 算 术 : 
(md mod n)* mod n = m” mod n = m“ mod n = (m’ mod n)“ mod n 
RSA 的 安全 性 依赖 于 这 样 的 事实 : 目前 没有 已 知 的 算法 可 以 快速 进行 一 个 数 的 因数 分 
解 ， 这 种 情况 下 公开 值 无 法 快速 分 解 成 素数 p 和 g。 如 果 已 知 p 和 gq， 则 给 定 公开 值 e， 
就 很 容易 计算 出 秘密 密 钥 4。 另 一 方面 ， 不 确定 是 否 存 在 因数 分 解 一 个 数 的 快速 算法 ， 从 
这 种 意义 上 来 说 ，RSA 的 安全 性 也 不 是 确保 的 。 
另 一 种 流行 的 公 钥 加 密 算 法 是 Diffie- Hellman， 我 们 将 在 课 后 习题 中 简要 探讨 它 。 
Diffie- Hellman 并 不 像 RSA 那样 多 功能 ， 即 它 不 能 用 于 加 密 任 意 长 度 的 报 文 ; 然而 ， 它 能 
够 用 来 创建 一 个 对 称 的 会 话 密 钥 ， 该 密 钥 再 被 用 于 加 密 长 报 文 。 


8.3 报 文 完整 性 和 数字 签名 


在 前 面 一 节 中 我 们 看 到 了 能 够 使 用 加 密 为 两 个 通信 实体 提供 机 密 性 。 在 本 节 中 我 们 转 
向 提供 报 文 完整 性 (message integrity) 这 个 同等 重要 的 主题 。 报 文 完整 性 也 称 为 报 文 鉴 
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别 。 连 同 报 文 完整 性 ， 在 本 节 中 我 们 将 讨论 两 个 相关 的 主题 : 数字 签名 和 端点 鉴别 。 

我 们 再 次 使 用 Alice 和 Bob 来 定义 报 文 完整 性 问题 。 假 定 Bob 接收 到 一 个 报 文 (这 可 
能 已 经 加 密 或 可 能 是 明文 ) ， 并 且 他 认为 这 个 报 文 是 由 Alice 发 送 的 。 为 了 鉴别 这 个 报 文 ， 
Bob 需要 证 实 

1) 该 报 文 的 确 源 自 Alice。 

2) 该 报 文 在 到 Bob MIE PUA KAA, 

我 们 将 在 8.4 ~ 8.7 节 中 看 到 ， 报 文 完 整 性 这 个 问题 在 所 有 安全 网 络 协议 中 都 是 至 关 
重要 的 。 

举 一 个 特定 的 例子 ， 考 虑 一 个 使 用 链 路 状态 路 由 选择 算法 〈 例 如 OSPF) 的 计算 机 网 
络 ， 在 该 网 络 中 决定 每 对 路 由 器 之 间 的 路 由 (参见 第 5 章 ) 。 在 一 个 链 路 状态 算法 中 ， 每 
台 路 由 器 需要 向 该 网 络 中 的 所 有 其 他 路 由 器 广播 一 个 链 路 状态 报 文 。 路 由 器 的 链 路 状态 报 
文 包括 直接 相连 邻居 的 列表 以 及 到 这 些 邻 居 的 直接 费用 。 一 旦 某 台 路 由 器 从 其 他 所 有 路 由 
器 收 到 了 链 路 状态 报 文 ， 它 能 够 生成 该 网 络 的 全 图 ， 运 行 它 的 最 小 费用 路 由 选择 算法 并 配 
置 它 的 转发 表 。 对 路 由 选择 算法 的 一 个 相对 容易 的 攻击 是 ，Trudy 分 发 具有 不 正确 状态 信 
息 的 虚假 链 路 状态 报 文 。 因 此 产生 了 报 文 完整 性 的 需求 : 当 路 由 器 B 收 到 来 自 路 由 器 A 的 
链 路 状态 报 文 时 ， 路 由 器 B 应 当 证 实 路 由 器 A 实际 生成 了 该 报 文 ， 并 且 进 一 步 证 实在 传输 
过 程 中 该 报 文 没有 被 算 改 。 

在 本 节 中 ， 我 们 描述 一 种 由 许多 安全 网 络 协议 所 使 用 的 流行 报 文 完整 性 技术 。 但 在 做 
此 事 之 前 ， 我 们 需要 涉及 密码 学 中 的 另 一 个 重要 主题 ， 即 密码 散 列 函数 。 


8.3.1 密码 散 列 函数 


如 图 8-7 所 示 ， 散 列 函数 以 m 为 输入 ， 并 计算 得 到 一 个 称 为 散 列 的 固定 长 度 的 字符 串 
H(m)。 因 特 网 检验 和 (第 3 章 ) 和 CRC (第 6 章 ) 都 满足 这 个 定义 。 密码 散 列 函数 
(cryptographic hash function) 要 求 具 有 下 列 附 加 的 性 质 : 

© 找到 任意 两 个 不 同 的 报 文 x 和 yy 使 得 H(x) =H(y)， 在 计算 上 是 不 可 能 的 。 

不 严格 地 说 ， 这 种 性 质 就 意味 着 人 侵 者 在 计算 上 不 可 能 用 其 他 报 文 替换 由 散 列 函数 保 
护 的 报 文 。 这 就 是 说 ， 如 果 (m, A(m)) 是 报 文 和 由 发 送 方 生成 的 报 文 散 列 的 话 ， 则 入 
侵 者 不 可 能 伪造 另 一 个 报 文 y 的 内 容 ， 使 得 该 报 文具 有 与 原 报 文 相 同 的 散 列 值 。 





图 8-7 散 列 函数 
我 们 来 证 实 一 个 简单 的 检验 和 ( 如 因特网 检验 和 ) 只 能 算 作 劣 质 的 密码 散 列 函数 。 不 
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像 在 因特网 检验 和 中 执行 反 码 运算 那样 ， 我 们 把 每 个 字符 看 作 一 个 字 节 ， 并 把 这 些 字 节 加 
到 一 起 ， 一 次 用 4 字 节 的 块 来 进行 计算 。 假 定 Bob X Alice 100. 99 美元 并 且 疝 Alice 发 送 一 
张 借 据 ， 这 个 借据 包含 文本 字符 串 “IOU100. 99BOB”。 这 些 字 符 的 ASCI 表示 〈 以 十 六 进 
制 形 式 ) 49, 4F, 55, 31, 30, 30, 2E, 39, 39, 42, 4F, 42, 

图 8-8 上 半 部 分 显示 了 这 个 报 文 的 4 字 节 检验 和 是 B2 Cl D2 AC, KI 8-8 下 半 部 分 显 
示 了 一 条 稍微 不 同 的 报 文 ( 但 是 Bob 要 付 的 钱 却 多 了 许多 ) 。 报 文 “IOU100. 99BOB” 和 
“TOU900. 19BOB” 有 相同 的 检验 和 。 因 此 ， 这 种 简单 的 检验 和 算法 违反 了 上 述 要 求 。 给 定 
初始 数据 ， 很 容易 找到 有 相同 检验 和 的 另 一 组 数据 。 很 明显 ， 为 了 安全 起 见 ， 我 们 需要 比 
检验 和 更 为 强 有 力 的 散 列 函数 。 

Ron Rivest [ RFC 1321] 的 MD5 散 列 算法 
如 今 正在 广泛 使 用 。 这 个 算法 通过 4 步 过 程 计 
算得 到 128 比特 的 散 列 。 这 4 步 过 程 由 下 列 步 
RAM: 填充 一 一 先 填 1 ， 然 后 填 足 够 多 的 
0， 直 到 报 文 长 度 满足 一 定 的 条 件 ; OH 
加 一 一 在 填充 前 添加 一 个 用 64 比特 表示 的 报 
XKE; @ 初 始 化 累加 器 ; @ 循 环 一 一 在 最 后 
的 循环 步骤 中 ， 对 报 文 的 16 字 块 进行 4 轮 处 
理 。MD5 的 描述 (包括 一 个 C 源 代 码 实 现 ) 
Wee LEG al dy 图 8-8 ”初始 报 文 和 欺诈 报 文具 有 相同 的 检验 和 

目前 正 使 用 的 第 二 个 主要 散 列 算法 是 安全 
散 列 算法 SHA- 1 (Security Hash Algorithm) [FIPS 1995] 。 这 个 算法 的 原理 类 似 于 MD4 
[RFC 1320] 设计 中 所 使 用 的 原理 ， 而 MD4 是 MDS 的 前 身 。SHA-1 是 美国 联邦 政府 的 标 
准 ， 任 何 联邦 政府 的 应 用 程序 如 果 需 要 使 用 密码 散 列 算法 的 话 ， 都 要 求 使 用 SHA-1。SHA- 
1 生成 一 个 160 比特 的 报 文摘 要 。 较 长 的 输出 长 度 可 使 SHA-1 更 安全 。 


8.3.2 报 文 鉴别 码 


我 们 现在 再 回 到 报 文 完整 性 的 问题 。 既 然 我 们 理解 了 散 列 函数 ， 就 先 来 看 一 下 将 如 何 
执行 报 文 完整 性 : 

1) Alice 生成 报 文 m 并 计算 散 列 Hm) 〈 例 如 使 用 SHA-1) 。 

2) 然后 Alice ¥ H(m) 附加 到 报 文 m 上 ， 生 成 一 个 扩展 报 文 (m, H(m)), ， 并 将 该 
扩展 报 文 发 给 Bob。 

3) Bob 接收 到 一 个 扩展 报 文 (m, h) 并 计算 H(m)。 如 果 H(m) =h, Bob 得 到 结 
论 : 一 切 正常 。 

这 种 方法 存在 明显 缺陷 。Trudy 能 够 生成 虚假 报 文 m'， 在 其 中 声称 她 就 是 Alice, HA 
H(m') 并 发 送 给 Bob (m', H(m')). 4 Bob 接收 到 该 报 文 ， 一 切 将 在 步骤 3 中 核对 通 
过 ， 并 且 Bob 无 法 猜 出 这 种 不 轨 的 行为 。 

为 了 执行 报 文 完 整 性 ， 除 了 使 用 密码 散 列 函数 外 ，Alice 和 Bob 将 需要 共享 秘密 *。 这 
个 共享 的 秘密 只 不 过 是 一 个 比特 串 ， 它 被 称 为 鉴别 密 钥 (authentication key) 。 使 用 这 个 共 
享 秘密 ， 报 文 完整 性 能 够 执行 如 下 : 

1) Alice 生成 报 文 m, FAs 级 联 m 以 生成 m +s， 并 计算 散 列 8(m+s) (例如 使 用 
SHA-1), H(m+s) 被 称 为 报 文 鉴别 码 (Message Authentication Code, MAC). 
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2) 然后 Alice 将 MAC 附加 到 报 文 m 上 ， 生 成 扩展 报 文 (m，H(m +s))， 并 将 该 扩展 
报 文 发 送 给 Bob。 

3) Bob 接收 到 一 个 扩展 报 文 (m,，h)， 由 于 知道 ;， 计 算出 报 文 鉴别 码 H(m+s)。 如 
RH(m+s) =h, Bob 得 到 结论 : 一 切 正常 。 

图 8-9 中 总 结 了 上 述 过 程 。 读 者 应 当 注 意 到 这 里 的 MAC (表示 “ 报 文 鉴 别 码 ”) 与 用 
于 数据 链 路 层 中 的 MAC (表示 “媒体 访问 控制 ”) 是 不 一 样 的 ! 


o “ts 






图 8-9 报 文 鉴别 码 


MAC 的 一 个 优良 特点 是 它 不 要 求 一 种 加 密 算法 。 的 确 ， 在 许多 应 用 中 ,包括 前 面 讨 
论 的 链 路 状态 路 由 选择 算法 ,通信 实体 仅 关心 报 文 完整 性 ， 并 不 关心 报 文 机 密 性 。 使 用 
MAC,， 实 体能 够 鉴别 它们 相互 发 送 的 报 文 ， 而 不 必 在 完整 性 过 程 中 综合 进 复杂 的 加 密 
过 程 。 

如 你 所 猜测 ， 多 年 来 已 经 提出 了 若干 种 对 MAC 的 不 同 标准 。 目 前 最 为 流行 的 标准 是 
HMAC， 它 能 够 与 MD5 或 SHA-1 一 道 使 用 。HMAC 实际 上 通过 散 列 函数 运行 数据 和 鉴别 
密 钥 两 次 [Kaufman 1995; RFC 2104], 

这 里 还 遗留 下 一 个 重要 问题 。 怎 样 向 通信 实体 分 发 这 个 共享 的 鉴别 密 钥 呢 ? 例如 ， 在 
链 路 状态 路 由 选择 算法 中 ， 在 某 种 程度 上 需要 向 自治 系统 中 的 每 台 路 由 器 分 发 该 秘密 鉴别 
BH. 注意 到 所 有 路 由 器 都 能 够 使 用 相同 的 鉴别 密 钥 。) 一 名 网 络 管理 员 能 够 通过 物理 上 
访问 每 台 路 由 器 来 实际 完成 这 项 工作 。 或 者 ， 如 果 这 名 网 络 管理 员 不 够 勤快 ， 并 且 每 台 路 
由 器 都 有 它 自 己 的 公 钥 ， 那 么 该 网 络 管理 员 能 够 用 路 由 器 的 公 钥 加 密 鉴别 密 钥 并 分 发 给 任 
何 一 台 路 由 器 ， 从 而 通过 网 络 向 路 由 器 发 送 加 密 的 密 钥 。 


8. 3.3 数字 签名 


回想 在 过 去 的 一 周 中 你 在 纸 上 已 经 签 过 多 少 次 你 的 名 字 。 你 可 能 经 常会 在 支票 、 信 用 
卡 收据 、 法 律 文件 和 信件 上 签名 。 你 的 签名 证 明 你 〈 而 不 是 其 他 人 ) 承认 和 /或 同意 这 些 
文件 的 内 容 。 在 数字 领域 ， 人 们 通常 需要 指出 一 个 文件 的 所 有 者 或 创作 者 ， 或 者 表明 某 人 
认可 一 个 文件 内 容 。 数 字 签名 (digital signature) 就 是 一 种 在 数字 领域 实现 这 些 目标 的 密 
码 技术 。 

正如 手工 签字 一 样 ， 数 字 签 名 也 应 当 以 可 鉴别 的 、 不 可 伪造 的 方式 进行 。 这 就 是 说 ， 
必须 能 够 证 明 由 某 个 人 在 一 个 文件 上 的 签名 确实 是 由 该 人 签署 的 〈 该 签名 必须 是 可 证 实 
的 ) ， 且 只 有 那个 人 能 够 签署 那个 文件 〈 该 签名 无 法 伪造 ) 。 
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我 们 现在 来 考虑 怎样 设计 一 个 数字 签名 方案 。 当 Bob 签署 一 个 报 文 时 ， 可 以 观察 到 
Bob 必须 将 某 些 对 他 独特 的 东西 放置 在 该 报 文 上 。Bob 可 以 考虑 附加 一 个 MAC 用 作 签 名 ， 
其 中 MAC 是 由 他 的 密 钥 〈 对 他 是 独特 的 ) 作用 到 该 报 文 上 而 生成 的 ， 然 后 得 到 该 散 列 值 。 
而 Alice 为 了 验证 该 签名 ， 她 必须 也 具有 该 密 钥 的 副本 ， 下 Bob 将 不 
是 唯一 的 。 因 此 ， 此 时 MAC 是 无 法 胜任 这 项 工作 的 。 

前 面 讲 过 使 用 公 钥 密码 ，Bob 具有 公 钥 和 私 钥 ， 这 两 种 密 钥 对 Bob 均 为 独特 的 。 因 
此 ， 公 钥 密 钥 是 一 种 提供 数字 签名 的 优秀 候选 者 。 我 们 现在 来 研究 一 下 这 是 怎样 完成 的 。 

假设 Bob 要 以 数字 方式 签署 一 个 文档 m。 我 们 能 够 想象 这 个 文档 是 Bob 打算 签署 并 发 
送 的 一 个 文件 或 一 个 报 文 。 如 图 8-10 ta, 为 了 签署 这 个 文档 ，Bob 直接 使 用 他 的 私 铀 
Ks 计算 Ks (m)。 竺 一 看 ， 会 感觉 很 奇怪 ，Bob 怎么 会 用 他 的 私 钥 (在 8.2 节 中 ,我 们 用 
私 钥 解密 用 其 公 钥 加 密 的 报 文 ) 签署 文档 ! 但 是 回想 加 密 和 解密 都 只 不 过 是 数学 运算 
(RSA 中 所 做 的 e 或 4 指数 客运 算 ; 参见 8.2 节 ) ， 并 且 Bob 的 目的 不 是 弄 乱 或 掩盖 文档 的 
内 容 ， 而 只 是 以 可 鉴别 、 不 可 伪造 的 方式 签署 这 个 文档 。Bob 对 文档 m 签名 之 后 所 得 的 文 
档 就 是 Ks (m) 。 


报 文 : m 签名 的 报 文 : Ks (m) 


Q= 
Bob 的 私 钥 K5 





8-10 为 一 个 文档 生成 一 个 数据 签名 


数字 签名 Ks (m) 是 否 满足 了 可 鉴别 、 不 可 伪造 的 需求 ? 假设 Alice A m 和 Ks (m)。 
她 要 在 法 庭 上 证 明 (进行 诉讼 ) Bob 确实 签署 过 这 个 文档 ， 他 就 是 唯一 能 够 签署 该 文档 的 
Ao Alice 持 有 Bob 的 公 钥 Ks ， 并 把 它 用 于 Bob 的 数字 签名 Ks (m) ， 从 而 得 到 了 文档 m, 
也 就 是 说 ，Alice 计算 Ks (Ks (m) ) 。 瞧 ! 在 Alice 经 历 了 令 人 注目 的 慌乱 后 得 到 了 m, € 
与 初始 文档 完全 一 致 。 然 后 ，Alice 就 可 以 论证 仅 有 Bob 能 够 签署 这 个 文档 ， 基 于 如 下 
理由 : 
© 无 论 是 谁 签署 这 个 报 文 ， 都 必定 在 计算 签名 K; (m) 过 程 中 使 用 了 Ks 这 个 私 钥 ， 
使 Ki (Ks (m)) =m, 
© 知道 Ks 这 个 私 钥 的 唯一 人 只 有 Bob。 从 8. 2 节 我 们 对 RSA 的 讨论 中 可 知 ， 知 道 公 
钥 Ks 无 助 于 得 知 私 钥 Ks 的 信息 。 因 此 ， 知 道 私 钥 Ks 的 人 才 是 生成 密 钥 对 
(Kp, Ke) 的 人 ， 而 这 个 人 首当其冲 就 是 Bob。 (注意 到 此 处 假设 Bob 没有 把 Ks 
泄露 给 任何 人 ， 也 没有 人 从 Bob 处 窃取 到 Ks o) 
注意 到 下 列 问题 是 重要 的 : 如 果 源 文档 m 被 修改 过 ， 比 如 改 成 了 另 一 个 文档 到 Ml 
Bob 对 m 生成 的 签名 对 m' 无 效 ， 因 为 Ks (Ks (m)) 不 等 于 mm" 。 因 此 我 们 看 到 数字 签名 也 
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提供 完整 性 ， 使 得 接收 方 验证 该 报 文 未 被 自 改 ， 同 时 也 验证 了 该 报 文 的 源 。 

对 用 加 密 进行 数据 签名 的 担心 是 ， 加 密 和 解密 的 计算 代价 昂贵 。 给 定 加 解密 的 开销 ， 
通过 完全 加 密 /解密 对 数据 签名 是 杀 鸡 用 和 牛刀。 更 有 效 的 方法 是 将 散 列 函 数 引 入 数字 签名 。 
8.3.2 节 中 讲 过 ,一 种 散 列 算法 取 一 个 任意 长 的 报 文 m， 计 算 生成 该 报 文 的 一 个 固定 长 度 
的 数据 “指纹 ”"， 表 示 为 H(m)。 使 用 散 列 函数 ，Bob 对 报 文 的 散 列 签名 而 不 是 对 报 文本 
HEX, Bll Bob 计算 Ks (H(m))。 因 为 H(m) 通常 比 报 文 m 小 得 多 ， 所 以 生成 数字 签 
名 所 需要 的 计算 量 大 为 降低 。 

在 Bob 向 Alice 发 送 一 个 报 文 的 情况 下 ， 图 8-11 提供 了 生成 数字 签名 的 操作 过 程 的 概 
Wo Bob 让 他 的 初始 长 报 文通 过 一 个 散 列 函数 。 然 后 他 用 自己 的 私 钥 对 得 到 的 散 列 进行 数 
字 签 名 。 明 文 形式 的 初始 报 文 连同 已 经 数字 签名 的 报 文摘 要 〈 从 此 以 后 可 称 为 数字 签名 ) 
一 道 被 发 送 给 Alice。 图 8-12 提供 了 鉴别 报 文 完整 性 的 操作 过 程 的 概览 。Alice 先 把 发 送 方 
的 公 钥 应 用 于 报 文 获得 一 个 散 列 结果 。 然 后 她 再 把 该 散 列 函数 应 用 于 明文 报 文 以 得 到 第 二 
个 散 列 结果 。 如 果 这 两 个 散 列 匹 配 ， 则 Alice 可 以 确信 报 文 的 完整 性 及 其 发 送 方 。 


è 长 报 文 


Dear Alice: 
This is a VERY long letter 
since there is so much to 
多 对 一 散 列 函数 









固定 长 度 散 列 








发 送 给 Alice 的 包 


N Bob 的 


FHK; 
图 8-11 发 送 数字 签名 的 报 文 


在 继续 学 习 之 前 ， 我 们 简要 地 将 数字 签名 与 MAC 进行 比较 ， 尽 管 它们 有 类 似 之 处 ， 
但 也 有 重要 的 微妙 差异 。 数 字 签 名 和 MAC 都 以 一 个 报 文 (或 一 个 文档 ) 开始 。 为 了 从 
该 报 文中 生成 一 个 MAC， 我 们 为 该 报 文 附加 一 个 鉴别 密 钥 ， 然 后 取得 该 结果 的 散 列 。 
注意 到 在 生成 MAC 过 程 中 既 不 涉及 公开 密 钥 加 密 ， 也 不 涉及 对 称 密 钥 加 密 。 为 了 生成 
一 个 数字 签名 ， 我 们 首先 取得 该 报 文 的 散 列 ， 然 后 用 我 们 的 私 钥 加 密 该 报 文 〈 使 用 公 钥 
密码 ) 。 因 此 ， 数 字 签 名 是 一 种 “技术 含量 更 高 ”的 技术 ， 因 为 它 需 要 一 个 如 后 面 描述 
的 、 具 有 认证 中 心 支撑 的 公 钥 基础 设施 (PKI) 。 我 们 将 在 8.4 节 中 看 到 ，PGP 是 一 种 流 
行 的 安全 电子 邮件 系统 ， 为 了 报 文 完 整 性 而 使 用 数字 签名 。 我 们 已 经 看 到 了 OSPF 为 了 
报 文 完 整 性 而 使 用 MAC。 我 们 将 在 8.5 节 和 8.6 节 中 看 到 MAC 也 能 用 于 流行 的 运输 层 
和 网 络 层 安全 协议 。 










Fgkopdgoo69cmxw 
54psdterma[asofmz 


| 签名 的 散 列 
NW 


Dear Alice: 
This is a VERY long letter 
since there is so much to 
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图 8-12 ”验证 签名 报 文 

公 钥 认证 

数字 签名 的 一 个 重要 应 用 是 公 钥 认证 (public key certification) ， 即 证 实 一 个 公 钥 属于 
某 个 特定 的 实体 。 公 钥 认 证 用 在 许多 流行 的 安全 网 络 协议 中 ， 包括 IPsec 和 SSL, 

为 了 深入 理解 这 个 问题 ,我 们 考虑 一 个 因特网 商务 版 本 的 经 典 的 “比萨 恶作剧 ”。 假 
定 Alice 正在 从 事 比萨 派送 业务 ， 从 因特网 上 接受 订单 。Bob 是 一 个 爱 吃 比萨 的 人 ， 他 向 
Alice 发 送 了 一 份 包含 其 家 庭 地 址 和 他 和 希望 的 比萨 类 型 的 明文 报 文 。Bob 在 这 个 报 文中 也 包 
含 一 个 数字 签名 〈 即 对 原始 明文 报 文 的 签名 的 散 列 ) ， 以 向 Alice 证 实 他 是 该 报 文 的 真正 来 
源 。 为 了 验证 这 个 数字 签名 ，Alice 获得 了 Bob 的 公 钥 (也 许 从 公 钼 服务 器 或 通过 电子 邮 
件 报 文 ) 并 核对 该 数字 签名 。 通 过 这 种 方式 ，Alice 确信 是 Bob 而 不 是 某 些 青少年 恶作剧 
者 下 的 比萨 订单 。 

在 聪明 的 Trudy 出 现 之 前 ， 这 一 切 看 起 来 进行 得 相当 好 。 如 图 8-13 中 所 示 ，Trudy ii 
溺 于 一 场 恶作剧 中 。Trudy 向 Alice 发 送 一 个 报 文 ， 在 这 个 报 文中 她 说 她 是 Bob， 给 出 了 
Bob 家 的 地 址 并 订购 了 一 个 比萨 。 在 这 个 报 文中 ， 她 也 包括 了 她 (Trudy) WAH, BRA 
Alice 自然 地 假定 它 就 是 Bob 的 公 钥 。Trudy 也 附加 了 一 个 签名 ， 但 这 是 用 她 自己 (Trudy) 
的 私 钥 生 成 的 。 在 收 到 该 报 文 后 ，Alice 就 会 用 Trudy HAH (Alice 认为 它 是 Bob 的 公 钥 ) 
来 解密 该 数字 签名 ， 并 得 到 结论 : 这 个 明文 报 文 确实 是 由 Bob 生成 的 。 而 当 外 送 人 员 带 着 
具有 意大利 辣 香 肠 和 凤 尾 鱼 的 比萨 到 达 Bob 家 时 ， 他 会 感到 非常 惊讶 ! 

从 这 个 例子 我 们 看 到 ， 要 使 公 钥 密码 有 用 ， 需 要 能 够 证 实 你 具有 的 公 钥 实际 上 就 是 与 
你 要 进行 通信 的 实体 (人 员 、 路 由 器 、 浏 览 器 等 ) 的 公 钥 。 例 如 ， 当 Alice 与 Bob 使 用 公 
钥 密 码 通信 时 ， 她 需要 证 实 她 假定 是 Bob 的 那个 公 钥 确实 就 是 Bob HAH. 

将 公 钥 与 特定 实体 绑 定 通常 是 由 认证 中 心 (Certification Authority, CA) 完成 的 ，CA 
的 职责 就 是 使 识别 和 发 行 证 书 合 法 化 。CA 具有 下 列 作用 : 
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FA 8-13 Trudy 用 公 钥 密码 冒充 Bob 


1) CA 证 实 一 个 实体 (一 个 人 、 一 台 路 由 器 等 ) 的 真实 身份 。 如 何 进行 认证 并 没有 
强制 的 过 程 。 当 与 一 个 CA 打交道 时 ,一 方 必须 信任 这 个 CA 能 够 执行 适当 的 严格 身份 验 
证 。 例 如 ， 如 果 Trudy 走 进 名 为 Fly-by-Night 的 认证 中 心 并 只 是 宣称 “我 是 Alice”， 就 可 以 
得 到 该 机 构 颁发 的 与 Alice 的 身份 相关 联 的 证 书 的 话 ， 则 人 们 不 会 对 Fly-by-Night 认证 中 心 
所 签发 的 公 钥 证 书 有 太 多 的 信任 。 另 一 方面 ， 人 们 可 能 愿意 (或 不 愿意 !) 信任 某 个 CA, 
如 果 这 个 CA 是 联邦 或 州 计 划 的 一 部 分 的 话 。 你 对 与 公 钥 相关 联 的 身份 的 信任 程度 ， 仅 能 
达到 你 对 CA 及 其 身份 验证 技术 的 信任 程度 。 我 们 编织 了 多 么 混乱 的 信任 关系 网 啊 ! 

2) 一 旦 CA 验证 了 某 个 实体 的 身份 ， 这 个 CA 会 生成 一 个 将 其 身份 和 实体 的 公 钥 绑 定 
起 来 的 证 书 (certificate) 。 这 个 证 书包 含 这 个 公 钥 和 公 钥 所 有 者 全 局 唯一 的 身份 标识 信息 
(例如 ,一 个 人 的 名 字 或 一 个 IP 地 址 )。 由 CA 对 这 个 证 书 进行 数字 签名 。 这 些 步 骤 显 示 


在 图 8-14 中 。 

我 们 现在 来 看 怎样 使 用 认证 来 对 抗 
“比萨 订购 ”中 的 恶作剧 者 (如 Trudy) 
和 其 他 意外 情况 。Bob 下 订单 的 同时 ， 
他 也 发 送 了 其 CA 签署 的 证 书 。Alice 使 
用 CA 的 公 钥 来 核对 Bob 证 书 的 合法 性 
并 提取 Bob HAA. 

际 电 信 联 盟 (JInternational Tele- 
communication Union, ITU) 和 IETF 都 
研发 了 用 于 CA 的 系列 标准 。ITU X. 509 
[ITU 2005a] 规定 了 证 书 的 鉴别 服务 以 
及 特定 语法 。 [RFC 1422] 描述 了 安全 





Bob 的 CA 签署 的 
证 书包 含 了 他 的 
BRK; 


CA 的 私 钥 Ki 
= 


(CA) 









图 8-14 Bob 获得 一 份 来 自 CA 的 证 书 
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因特网 电子 邮件 所 用 的 基于 CA 的 密 钥 管理 。 它 和 X. 509 兼容 ， 但 比 X. 509 增加 了 密 钥 管 
理 体 系 结构 的 创建 过 程 和 约定 内 容 。 表 8-4 显示 了 一 份 证 书 中 的 某 些 重要 字段 。 


表 8-4 在 X. 509 和 RFC 1422 公 铀 证 书 中 的 部 分 字段 























字段 名 描述 

版 本 (Version) X 509 规范 的 版 本 号 

序列 号 (Serial number) CA 发 布 的 证 书 的 独特 标识 符 

签名 (Signature) 规定 了 由 CA 所 用 的 对 该 证 书签 名 的 算法 

颁发 者 名 称 (Issuer name) 发 行 该 证 书 的 CA 的 标识 符 ， 用 的 是 区 别名 (DN) 格式 [RFC 4514] 

有 效 期 (Validity period) 证 书 合法 性 开始 和 结束 的 时 间 范 围 

主题 名 (Subject name) 其 公 钥 与 该 证 书 相 联系 的 实体 标识 符 ， 用 DN 格式 

主题 公 钥 (Subject public key) 该 主题 的 公 钥 以 及 该 公 钥 使 用 的 公 钥 算法 〈 及 其 参数 ) 的 指示 
8.4 端点 鉴别 


端点 鉴别 (end-point authentication) 就 是 一 个 实体 经 过 计算 机 网 络 向 另 一 个 实体 证 明 
其 身份 的 过 程 ， 例 如 一 个 人 向 某 个 电子 邮件 服务 器 证 明 其 身份 。 作 为 人 类 ， 我们 通过 多 种 
方式 互相 鉴别 : 见面 时 我 们 互相 识别 对 方 的 面容 ， 打 电话 时 我 们 分 辨 对 方 的 声音 ， 海 关 的 
检查 官员 通过 护照 上 的 照片 对 我 们 进行 鉴别 。 

在 本 节 中 ， 我 们 讨论 经 网 络 通信 的 双方 如 何 能 够 鉴别 彼此 。 此 处 我 们 重点 关注 当 通 信 实 际 
发 生 时 鉴别 “活动 的 ”实体 。 一 个 具体 的 例子 是 一 个 用 户 向 某 电 子 邮件 服务 器 鉴别 他 或 她 自 
己 。 这 与 证 明 在 过 去 的 某 点 接收 到 的 报 文 确实 来 自 声称 的 发 送 方 稍 有 不 同 ， 如 8. 3 节 所 述 。 

当 经 网 络 进行 鉴别 时 ， 通 信 各 方 不 能 依靠 生物 信息 比如 外 表 、 声 波纹 等 进行 身份 鉴 
别 。 的 确 ， 我 们 会 在 后 面 的 实例 研究 中 看 到 ， 诸 如 路 由 器 、 客 户 /服务 器 进程 等 网 络 元 素 
通常 必须 相互 鉴别 。 此 处 ， 鉴 别 应 当 在 报 文 和 数据 交换 的 基础 上 ， 作 为 某 鉴别 协议 (au- 
thentication protocol) 的 一 部 分 独立 完成 。 鉴 别 协议 通常 在 两 个 通信 实体 运行 其 他 协议 ( 例 
如 ， 可 靠 数据 传输 协议 、 路 由 选择 信息 交换 协议 或 电子 邮件 协议 ) 之 前 运行 。 鉴 别 协议 首 
先 建立 相互 满意 的 各 方 的 标识 ; 仅 当 鉴别 完成 之 后 ， 各 方才 继续 下 面 的 工作 。 

同 第 3 章 中 我 们 阐释 可 靠 数 据 传输 协议 (rdt) 的 情况 类 似 ， 我 们 发 现 阐释 各 种 版 本 
的 鉴别 协议 一 一 我 们 将 称 为 ap (authentication protocol) 一 一 是 有 启发 的 ， 并 随 着 我 们 学 
习 的 深入 指出 各 个 版 本 的 漏洞 。 (如 果 你 喜欢 这 种 逐步 式 的 设计 演化 ， 你 也 许 喜 欢 看 
[ Bryant 1988 ] ， 这 本 书 虚构 了 开放 网 络 鉴别 系统 的 设计 者 间 的 故事 ， 以 及 他 们 对 许多 相关 
奇妙 问题 的 发 现 。) 


我 们 假设 Alce 要 向 Bób 鉴别 她 自 Alice Bob Alice Bob 
Lott @ 5 @ & 
我 是 Alice 


8.4.1 鉴别 协议 ap1.0 


HY 
也 许 我 们 能 够 想象 出 的 最 简单 的 鉴 S 
别 协议 就 是 ，Alice 直接 发 送 一 个 报 文 
给 Bob， 说 她 就 是 Alice。 这 个 协议 如 N S, 
图 8-15 所 示 。 这 个 协议 的 缺陷 是 明显 fa 


AY, BY Bob 无 法 判断 发 送 报 文 “我 是 图 8-15 协议 apl.0 和 一 种 失败 的 情况 
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Alice” 的 人 确实 就 是 Alice。 例 如 ，Trudy (入 侵 者 ) 也 可 以 发 送 这 样 的 报 文 。 
8.4.2 鉴别 协议 ap2.0 


如 果 Alice 有 一 个 总 是 用 于 通信 的 周知 网 络 地 址 (如 一 个 P Hh), N Bob 能 够 试图 
通过 验证 携带 鉴别 报 文 的 四 数据 报 的 源 地 址 是 否 与 Alice 的 周知 IP 地 址 相 匹配 来 进行 鉴 
别 。 在 这 种 情况 下 ，Alice 就 可 被 鉴别 了 。 这 可 能 阻止 对 网 络 一 无 所 知 的 人 假冒 Alice, 但 
是 它 却 不 能 阻止 决定 学 习 本 书 的 学 生 或 许多 其 他 人 ! 

根据 我 们 学 习 的 网 络 层 和 数据 链 路 层 的 知识 ， 我 们 就 会 知道 做 下 列 事情 并 不 困难 〈 例 
如 ， 如 果 一 个 人 能 够 访问 操作 系统 代码 并 能 构建 自己 的 操作 系统 内 核 一 一 比如 Linux 和 许多 
其 他 免费 可 用 的 操作 系统 ) : 生成 一 个 他 数据 报 ， 并 在 他 数据 报 中 填 入 我 们 希望 的 任意 源 地 
址 (比如 Alice 的 周知 全 地址)， 再 通过 链 路 层 协 议 把 生成 的 数据 报 发 送 到 第 一 跳 路 由 器 。 
此 后 ， 具 有 不 正确 源 地 址 的 数据 报 就 会 忠实 地 向 Bob 转发 。 这 种 方法 显示 在 图 8-16 中 ， 它 是 
IP 哄骗 的 一 种 形式 。 如 果 Trudy 的 第 一 Alice Alice 


跳 路 由 器 被 设置 为 只 转发 包含 Trudy 的 i a ® a 
IP WRG AO HEAR, BEAT ULES IPO A ggnie 7 

骗 [RFC 2827]。 然 而 ,这 一 措施 并 未 。 Tee wt 
得 到 广泛 采用 或 强制 实施 。Bob 可 能 因 SA 
为 假定 Trudy 的 网 络 管理 员 (这 个 管理 pe 
员 可 能 就 是 Trudy 自己 ) 已 经 配置 Trudy 

的 第 一 跳 路 由 器 ， 使 之 只 能 转发 适当 地 Tredy Trudy 

址 的 数据 报 而 被 欺骗 。 


8.4.3 鉴别 协议 ap3.0 


”进行 鉴别 的 一 种 经 典 方法 是 使 用 秘 
密 口令 。 口令 是 鉴别 者 和 被 鉴别 者 之 间 Alice Bob Alice Bob 


的 一 个 共享 秘密 。Gmail、Telnet、FTP ©, a ©, A 
和 许多 其 他 服务 使 用 口令 鉴别 。 在 协议 我 是 Alice, 口令 i 


图 8-16 协议 ap2.0 和 一 种 失败 的 情况 


ap3.0 中，Alice 因此 向 Bob 发 送 其 秘密 \ Eo cD 
令 ， 如 图 8-17 所 示 。 gk “oe 
由 于 口令 的 广泛 使 用 ， 我 们 也 许 猜 
起 协议 ap3.0 相当 安全 。 如 果 这 样 想 ， SS 
我 们 就 错 了 ! 这 里 的 安全 性 缺陷 相当 明 Trudy Trudy 


显 : 如 果 Trudy 窃听 了 Alice 的 通信 ， 则 we: 

可 得 到 Alice 的 口令 。 为 了 使 你 认识 到 这 国 磁带 记录 机 

种 可 能 性 ， 考 虑 这 样 的 事实 ， 当 你 Tel- 

net 到 另 一 个 机 器 上 并 登录 时 ， 登 录 口令 图 8-17 协议 ap3.0 和 一 种 失败 的 情况 

未 加 密 就 发 送 到 了 Telnet 服务 器 。 连 接 到 Telnet 客户 或 服务 器 LAN 的 某 个 人 都 可 能 嗅 控 
(sniff) 〈 读 并 存储 ) 在 局 域 网 上 传输 的 所 有 数据 分 组 ， 并 因此 窃取 到 该 注册 口令 。 实 际 
上 ， 这 是 一 种 窃取 口令 的 周知 方法 〈( 例 如， 参见 [Jimenez 1997] ) 。 这 样 的 威胁 显然 是 真 
实 存在 的 ， 所 以 协议 ap3. 0 明显 也 不 可 行 
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8.4.4 鉴别 协议 aps. 1 


我 们 完善 协议 ap3. 0 的 下 一 个 想法 自然 就 是 加 密 口 令 了 。 通 过 加 密 口令 ， 我 们 能 够 防 
ik Trudy 得 知 Alice 的 口令 。 如 果 我 们 假定 Alice 和 Bob 共享 一 个 对 称 秘密 密 钥 Kag, M 
Alice 可 以 加 密 口令 ， 并 向 Bob 发 送 其 识别 报 文 “ 我 是 Alice” 和 加 密 的 口令 。Bob 则 解密 
口令 ， 如 果 口 令 正确 则 鉴别 了 Alice。 因 为 Alice 不 仅 知道 口令 ， 而 且 知 道 用 于 加 密 口 令 的 
共享 秘密 密 钥 值 ，Bob 才 可 以 轻松 地 鉴别 Alice 的 身份 。 我 们 称 这 个 协议 为 ap3. 1。 

尽管 协议 ap3. 1 确实 防止 了 Trudy 得 知 Alice 的 口令 ， 此 处 使 用 密码 术 并 不 能 解决 鉴别 
问题 。Bob 受制 于 回放 攻击 (playback attack); Trudy 只 需 窃听 Alice 的 通信 ， 并 记录 下 该 
口令 的 加 密 版 本 ， 并 向 Bob 回放 该 口令 的 加 密 版 本 ， 以 假装 她 就 是 Alice。 协 议 ap3. 1 中 加 
密 口 令 的 使 用 ， 并 未 使 它 比 图 8-17 中 的 协议 ap3. 0 的 局 面 有 明显 改观 。 


8.4.5 鉴别 协议 ap4.0 


图 8-17 中 的 失败 的 情况 是 因为 Bob 不 能 区 分 Alice 的 初始 鉴别 报 文 和 后 来 人 侵 者 回放 
的 Alice 的 初始 鉴别 报 文 所 致 。 也 就 是 说 ，Bob 无 法 判断 Alice 是 否 还 活跃 ( 即 当 前 是 否 还 
在 连接 的 另 一 端 ) ， 或 他 接收 到 的 报 文 是 否 就 是 前 面 鉴别 Alice 时 录制 的 回放 。 观 察 力 极 强 
的 读者 会 记 起 TCP 的 三 次 握手 协议 需要 处 理 相 同 的 问题 ， 如 果 接 收 的 SYN 报 文 段 来 自 较 
早 连接 的 一 个 SYN 报 文 段 的 旧 副 本 (重新 传输 ) 的 话 ，TCP 连接 的 服务 器 一 侧 不 会 接受 
该 连接 。TCP 服务 器 一 侧 如 何 解决 “判断 客户 是 否 真 正 还 活跃 ”的 问题 呢 ? 它 选择 一 个 很 
长 时 间 内 都 不 会 再 次 使 用 的 初始 序号 ， 然 后 把 这 个 序号 发 给 客户 ， 然 后 等 待 客户 以 包含 这 
个 序号 的 ACK 报 文 段 来 响应 。 此 处 我 们 能 够 为 鉴别 目的 采用 同样 的 思路 。 

不 重 数 (nonce) 是 在 一 个 协议 的 生存 期 中 只 使 用 一 次 的 数 。 也 就 是 说 ， 一 旦 某 协 议 
使 用 了 一 个 不 重 数 ， 就 永远 不 会 再 使 用 那个 数字 了 。 协 议 ap4. 0 以 如 下 方式 使 用 一 个 不 
BR: 

1) Alice fa] Bob 发 送 报 文 “我 是 Alice”。 

2) Bob 选择 一 个 不 重 数 RR， 然后 把 这 个 值 发 送 给 Alice。 

3) Alice 使 用 她 与 Bob 共享 的 对 称 秘密 密 钥 K,_s 来 加 密 这 个 不 重 数 ， 然 后 把 加 密 的 不 
BRK, ,(R) 发 回 给 Bob, 与 在 协议 ap3. 1 中 一 样 ， 由 于 Alice 知道 K_s 并 用 它 加 密 一 个 
值 ， 就 使 得 Bob 知道 收 到 的 报 文 是 由 Alice 产生 的 。 这 个 不 重 数 用 于 确定 Alice 是 活跃 的 。 

4) Bob 解密 接收 到 的 报 文 。 如 果 解 密 得 到 的 不 重 数 等 于 他 发 送 给 Alice 的 那个 不 重 
数 ， 则 可 鉴别 Alice 的 身份 。 

协议 ap4. 0 如 图 8-18 所 示 。 通 过 使 用 这 个 在 生存 期 中 只 Alice Bob 
出 现 一 次 的 值 R， 然 后 核对 返回 的 值 K_s(R) Bob 能 够 确 
定 两 点 : Alice 是 她 所 声称 的 那个 人 (因为 她 知道 加 密 R 所 
需 的 秘密 密 钥 ) ，Alice 是 活路 的 (因为 她 已 经 加 密 了 Bob fil 


一 一 一: 
刚 产 生 的 不 重 数 R) 。 ae, 
不 重 数 和 对 称 密 钥 密码 体制 的 使 用 形成 了 ap4.0 的 基 | KaR i 


础 。 一 个 自然 的 问题 是 ， 我 们 是 否 能 够 使 用 不 重 数 和 公开 密 : : 
钥 密 码 体制 〈 而 不 是 对 称 密 钥 密码 体制 ) 来 解决 鉴别 问题 ? v v 
这 个 问题 将 在 本 章 后 面 的 习题 中 进行 探讨 。 图 8-18 协议 ap4.0 
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8.5 安全 电子 邮件 


在 前 面 的 各 节 中 ， 我 们 分 析 了 网 络 安全 中 的 基本 问题 ， 包 括 对 称 密 钥 密 码 体制 和 公开 
密 钥 密码 体制 、 端 点 鉴别 、 密 钥 分 发 、 报 文 完 整 性 和 数字 签名 。 我 们 现在 着 手 研 究 如 何 使 
用 这 些 工 具 在 因特网 中 提供 安全 性 。 

有 趣 的 是 ， 为 因特网 协议 栈 上 面 4 层 的 任 一 层 提供 安全 性 服务 是 可 能 的 。 当 为 某 一 特 
定 的 应 用 层 协 议 提 供 安 全 性 时 ， 则 使 用 这 一 协议 的 应 用 程序 将 能 得 到 一 种 或 多 种 安全 服 
务 ， 诸 如 机 密 性 、 鉴 别 或 完整 性 。 为 某 一 运输 层 协议 提供 安全 性 时 ， 则 所 有 使 用 这 一 协议 
的 应 用 程序 都 可 以 得 到 该 运输 层 协 议 所 提供 安全 性 服务 。 在 基于 主机 到 主机 的 网 络 层 提供 
安全 性 时 ， 则 所 有 运输 层 报 文 段 〈 当然 也 包括 所 有 应 用 层 数据 ) 都 可 以 得 到 该 网 络 层 所 提 
供 的 安全 服务 。 当 基于 一 条 链 路 提供 安全 性 时 ， 则 经 过 这 个 链 路 传输 的 所 有 帧 中 的 数据 都 
得 到 了 该 链 路 提供 的 安全 性 服务 。 

在 8.5 ~8.8 节 中 ,我 们 考察 了 如 何在 应 用 层 、 运 输 层 、 网 络 层 和 数据 链 路 层 中 使 用 
这 些 安全 性 工具 。 为 了 与 本 书 的 整体 框架 保持 一 致 ， 我 们 从 协议 栈 的 顶层 开始 ， 讨 论 在 应 
用 层 的 安全 性 。 我 们 的 方法 是 使 用 特定 的 应 用 程序 如 电子 邮件 ， 作 为 应 用 层 安 全 性 的 一 个 
学 习 案 例 。 然 后 我 们 沿 协议 栈 向 下 ， 分 析 SSL 协议 〈 它 在 运输 层 提供 安全 性 ) IPsec 协议 
( 它 在 网 络 层 提供 安全 性 ) ， 以 及 IEEE 802. 11 无 线 局 域 网 协议 的 安全 性 。 

你 可 能 会 感到 奇怪 : 为 什么 要 在 因特网 的 多 个 层次 上 提供 安全 性 功能 呢 ? 仅 在 网 络 层 
提供 安全 性 功能 并 加 以 实施 还 不 足够 吗 ? 对 这 个 问题 有 两 个 答案 。 首 先 ， 尽 管 可 以 通过 加 
密 数 据 报 中 的 所 有 数据 《〈 即 所 有 的 运输 层 报 文 段 ) ， 以 及 通过 鉴别 所 有 数据 报 的 源 卫 地 
址 ， 在 网 络 层 能 够 提供 “地 毯 式 覆盖 ”安全 性 ， 但 是 却 并 不 能 提供 用 户 级 的 安全 性 。 例 
如 ,一 个 商业 站 点 不 能 依赖 他 层 安 全 性 来 鉴别 一 个 在 该 站 点 购买 商品 的 顾客 。 因 此 ， 此 
处 除了 较 低 层 的 地 毯 式 覆 盖 安 全 性 外 ， 还 需要 更 高 层 的 安全 性 功能 。 第 二 ,. 在 协议 栈 的 较 
高 屋 上 部 署 新 的 因特网 服务 (包括 安全 性 服务 ) 通常 较为 容易 。 而 等 待 在 网 络 层 上 广泛 地 
部 署 安全 性 ， 可 能 还 需要 未 来 若干 年 才能 解决 ， 许 多 应 用 程序 的 开发 者 “着 手 做 起 来 ”， 
: 并 在 他 们 中 意 的 应 用 程序 中 引入 安全 性 功能 。 一 个 典型 的 例子 就 是 PGP( Pretty Good Priva- 
cy) ， 它 提供 了 安全 电子 邮件 (将 在 本 节 后 面 讨论 ) 。 由 于 只 需要 客户 和 服务 器 应 用 程序 代 
码 ，PGP 是 第 一 个 在 因特网 上 得 到 广泛 应 用 的 安全 性 技术 。 


8.5.1 安全 电子 邮件 


我 们 现在 使 用 8.2 节 和 8. 3 节 的 密码 学 原则 来 生成 一 个 安全 电子 邮件 系统 。 我 们 以 递 
进 的 方式 来 产生 这 个 高 层 设 计 ， 每 一 步 引 入 一 些 新 安全 性 服务 。 当 设计 安全 电子 邮件 系统 
时 ， 我 们 需要 记 住 最初 在 8. 1 节 中 所 介绍 的 那个 有 趣 的 例子 ， 即 Alice 和 Bob 之 间 的 风流 
韵事 。 设 想 一 下 Alice 发 送 一 个 电子 邮件 报 文 给 Bob, mi Trudy 试图 人 侵 的 情况 。 

在 做 出 为 Alice 和 Bob 设计 一 个 安全 电子 邮件 系统 的 努力 之 前 ， 我 们 应 当 首先 考虑 他 
们 最 为 希望 的 安全 特性 是 什么 。 重 中 之 重 是 机 密 性 。 正 如 8. 1 节 讨论 的 那样 ，Alice 或 Bob 
都 不 希望 Trudy 阅读 到 Alice 所 发 送 的 电子 邮件 报 文 。Alice 和 Bob 最 希望 在 该 电子 邮件 系 
统 中 看 到 的 第 二 种 特性 是 具备 发 送 方 鉴 别 。 特 别 是 ， 当 Bob 收 到 这 样 的 报 文 “I don’ t love 
you anymore. I never want to see you again. Formerly yours, Alice (我 不 再 爱 你 了 。 我 再 也 不 
想 看 到 你 了 。Alice) ”时 ，Bob 自然 而 然 地 要 确定 这 个 报 文 确实 来 自 Alice， 而 非 Trudy 发 
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送 的 。 另 外 ， 这 两 个 情人 欣赏 的 另 一 种 特性 是 报 文 完整 性 ， 也 就 是 说 ， 确 保 Alice 所 发 的 
报 文 在 发 送 给 Bob 的 过 程 中 没有 被 改变 。 最 后 ， 电 子 邮 件 系 统 应 当 提 供 接 收 方 鉴别 ; 即 
Alice 希望 确定 她 的 确 正在 向 Bob 发 信 ， 而 不 是 向 假冒 Bob 的 其 他 人 (如 Trudy) 发 信 。 

因此 我 们 从 处 理 最 为 关注 的 机 密 性 开始 。 提 供 机 密 性 的 最 直接 方式 是 Alice 使 用 对 称 
密 钥 技术 (如 DES 或 AES) 加 密 所 要 传输 的 报 文 ， 而 Bob 则 在 接收 时 对 报 文 解密 。 如 8. 2 
节 讨 论 的 那样 ， 如 果 对 称 密 钥 足 够 长 ， 且 仅 有 Alice 和 Bob 拥有 该 密 钥 ， 则 其 他 人 (包括 
Trudy) 要 想 读 懂 这 条 报 文 极为 困难 。 尽 管 这 种 方法 直截了当 ， 但 因为 仅 有 Alice 和 Bob A 
有 该 密 钥 的 副本 ， 这 使 得 分 发 对 称 密 钥 非 常 困 难 (我 们 在 8. 2 节 中 讨论 过 ) 。 因 此 我 们 自 
然 就 考虑 用 其 他 方法 一 一 公开 密 钥 密 码 (例如 使 用 RSA) 。 在 公开 密 钥 方法 中 ，Bob 使 得 
他 的 公 钥 为 公众 所 用 〈 例 如 ， 从 一 台 公 钥 服务 器 或 其 个 人 网 页 上 得 到 ) Alice 用 Bob 的 公 
钥 加 密 她 的 报 文 ， 然 后 向 Bob 的 电子 邮件 地 址 发 送 该 加 密 报 文 。 当 Bob 接收 到 这 个 报 文 
时 ， 只 需 用 他 的 私 钥 即 可 解密 之 。 假 定 Alice 确定 得 到 的 公 钥 是 Bob 的 公 钥 ， 这 种 方法 是 
提供 所 希望 的 机 密 性 的 极 好 方法 。 然 而 ， 存 在 的 一 个 问题 是 公开 密 钥 加 密 的 效率 相对 低 
下 ， 尤 其 对 于 长 报 文 更 是 如 此 。 

为 了 克服 效率 问题 ,我 们 利用 了 会 话 密 钥 (在 8.2.2 节 中 讨论 过 )。 具 体 来 说 : 
(DAlice 选 择 一 个 随机 对 称 会 话 密 钥 Ks;; 避 用 这 个 对 称 密 钥 加 密 她 的 报 文 m; DAW Bob 的 
AR Ks 加 密 这 个 对 称 密 钥 ; @ 级 联 该 加 密 的 报 文 和 加 密 的 对 称 密 钥 以 形成 一 个 “ 包 ”; 
OF Bob 的 电子 邮件 地 址 发 送 这 个 包 。 这 些 过 程 显 示 在 图 8-19 中 (在 这 张 图 和 下 一 张 图 
中 ， 带 圈 的 “+ ”表示 级 联 ， 带 圈 的 “ - ”表示 级 联 的 分 解 ) 。 当 Bob 接收 到 这 个 包 时 : 
他 使 用 其 私 钥 Ks 得 到 对 称 密 钥 Ky; @) 使 用 这 个 对 称 密 钥 Ks 解密 报 文 m。 


$ Ks(m) Ks(m) [kcm 
e | a 


Kj (Ks) Ks (Ks) 
Alice 发 送 电子 邮件 报 文 mm Bob 接 收 电子 邮件 报 文 mr 


8-19 Alice 使 用 一 个 对 称 会 话 密 钥 Ks 向 Bob 发 送 一 个 安全 电子 邮件 


设计 完 提供 机 密 性 的 安全 电子 邮件 系统 后 ， 现 在 我 们 设计 男 一 个 可 以 提供 发 送 方 鉴别 
和 报 文 完整 性 的 系统 。 我 们 暂且 假设 Alice 和 Bob 目前 不 关心 机 密 性 (他 们 要 和 其 他 人 分 
享 他 们 的 爱情 !) ， 只 关心 发 送 方 鉴别 和 报 文 完整 性 。 为 了 完成 这 个 任务 ， 我 们 使 用 如 8. 3 
节 所 描述 的 数字 签名 和 报 文摘 要 。 具 体 说 来 : DAlice 对 她 要 发 送 的 报 文 m 应 用 一 个 散 列 
函数 有 (例如 MD5) ， 从 而 得 到 一 个 报 文摘 要 ; @ 用 她 的 私 钥 Ki 对 散 列 函数 的 结果 进行 
签名 ， 从 而 得 到 一 个 数字 签名 ; @@ 把 初始 报 文 〈 未 加 密 ) 和 该 数字 签名 级 联 起 来 生成 一 个 
包 ; m Bob 的 电子 邮件 地 址 发 送 这 个 包 。 当 Bob 接收 到 这 个 包 时 : (他 将 Alice WAH 
Ky 应 用 到 被 签名 的 报 文摘 要 上 ; @ 将 该 操作 的 结果 与 他 自己 对 该 报 的 散 列 进行 比较 。 
在 图 8-20 中 阐述 了 这 些 步骤 。 如 8.3 节 中 所 讨论 ， 如 果 这 两 个 结果 相同 ， 则 Bob 完全 可 
以 确信 这 个 报 文 来 自 Alice A RRMA. 
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天 (AH (m)) K, (H(m)) 
Lao) 


nnn 


Alice 发 送 电子 邮件 报 文 mm Bob 接 收 电 子 邮 件 报 文 m 
图 8-20 ”使 用 散 列 函 数 和 数字 签名 来 提供 发 送 方 鉴别 和 报 文 完整 性 


现在 我 们 考虑 设计 一 个 提供 机 密 性 、 发 送 方 鉴别 和 报 文 完整 性 的 电子 邮件 系统 。 这 可 
以 通过 把 图 8-19 和 图 8-20 中 的 过 程 结合 起 来 而 实现 。Alice 首先 生成 一 个 预备 包 ， 它 与 
图 8-20 中 的 包 完 全 相同 ， 其 中 包含 她 的 初始 报 文 和 该 报 文 数 字 签 名 过 的 散 列 。 然 后 Alice 
把 这 个 预备 包 看 作 一 个 报 文 ， 再 用 图 8-19 中 的 发 送 方 的 步骤 发 送 这 个 新 报 文 ， 即 生成 一 
个 新 包 发 给 Bob。Alice 所 做 的 这 些 步骤 如 图 8-21 所 示 。 当 Bob 接收 到 这 个 包 后， 他 首先 
应 用 图 8-19 中 他 这 一 侧 的 步 又 ， 然 后 再 应 用 图 8-20 中 他 这 一 侧 的 步骤 。 应 当 明确 这 一 设 
计 的 目标 是 提供 机 密 性 、 发 送 方 鉴别 和 报 文 完整 性 。 注 意 到 在 这 一 方案 中 ，Alice 两 次 使 
用 了 公开 密 钥 密码 : 一 次 用 了 她 的 私 钥 ， 另 一 次 用 了 Bob 的 公 钥 。 类 似 地 ，Bob 也 两 次 使 
用 了 公开 密 钥 密 码 : 一 次 用 了 他 的 私 钥 ， 一 次 用 了 Alice 的 公 钥 。 


K; (H(m)) 
一 








图 8-21 Alice 使 用 对 称 密 钥 密 码 、 公 开 密 钥 密 码 、 散 列 函数 和 数字 签名 来 
提供 安全 性 、 发 送 方 鉴别 和 报 文 完整 性 


图 8-21 所 示 的 安全 电子 邮件 系统 可 能 在 大 多 数 情况 下 都 能 为 大 多 数 电子 邮件 用 户 提 
供 满意 的 安全 性 。 但 是 仍 有 一 个 重要 的 问题 没有 解决 。 图 8-21 中 的 设计 要 求 Alice 获得 
Bob 的 公 钥 ， 也 要 求 Bob 获得 Alice 的 公 钥 。 但 这 些 公 钥 的 分 发 并 不 是 一 个 小 问题 。 例 如 ， 
Trudy 可 能 假冒 Bob， 发 给 Alice 她 自己 的 公 钥 ， 并 告诉 Alice 这 个 公 钥 是 Bob KAH, tE 
得 Trudy 就 能 接收 到 Alice 发 给 Bob 的 报 文 。 如 我 们 在 8.3 节 所 学 ， 安 全 地 分 发 公 钥 的 一 种 
常用 方法 是 通过 CA 验证 该 公 钥 。 
8.5.2 PGP 


Philip Zimmermann 于 1991 年 所 写 的 PGP (Pretty Good Privacy) 是 电子 邮件 加 密 方案 
的 一 个 范例 [PGPI 2016 ] 。 在 公共 领域 中 有 各 种 版 本 的 PGP 可 供 使 用 ; 例如 ， 你 能 够 在 国 


410 8# 





际 PGP 的 主页 上 为 你 喜爱 的 平台 找到 PCP 软件 以 及 许多 有 趣 的 读物 [PGPI 2016], PGP 
的 设计 在 本 质 上 和 图 8-21 中 所 示 的 设计 相同 。PGP 软件 的 不 同 版 本 使 用 MDS 或 使 用 SHA 
来 计算 报 文摘 要 ; 使 用 CAST、 三 重 DES 或 IDEA 进行 对 称 密 钥 加 密 ; 使 用 RSA 进行 公开 
密 钥 加 密 。 

安装 PGP 时 ， 软 件 为 用 户 产生 一 个 公开 密 钥 对 。 该 公 钥 能 被 张贴 到 用 户 的 网 站 上 或 放置 
在 某 台 公 钥 服务 器 上 。 私 钥 则 使 用 用 
户口 令 进行 保护 。 用 户 每 次 访问 私 铀 “| sas 
时 都 要 输入 这 个 口令 。 PCP 允许 用 户 Can I see you tonight? 
选择 是 否 对 报 文 进行 数字 签名 、 mE Passionately yours, Alice 
RX, 或 同时 进行 数字 签名 和 加 密 。 Version: PGP for Personal Privacy 5.0 
图 8-22 显示 了 一 个 PGP 签名 的 报 文 。 Sr katane A E ME EPEE TEIE EE 
这 个 报 文 在 MIME 首部 之 后 出 现 。 报 
文中 的 加 密 数 据 为 K, (H(m)), 即 Æ 8-22 PGP 签名 报 文 
数字 签名 的 报 文摘 要 。 如 我 们 上 述 讨 
论 ，Bob 为 了 验证 报 文 的 完整 性 ， 需 要 得 到 Alice 的 公 钥 。 

图 8-23 显示 了 一 个 秘密 PCP 报 文 。 这 个 报 文 也 出 现在 MIME 首部 之 后 。 当 然 ， 明 文 
报 文 不 包括 在 这 个 秘密 电子 邮件 报 文中 。 当 一 个 发 送 方 〈 例 如 Alice) 要 确保 机 密 性 和 完 
整 性 时 ，PGP 在 如 图 8-23 所 示 的 报 文中 包含 一 个 类 似 于 图 8-22 中 的 报 文 。 








Version: PGP for Personal Privacy 5.0 
u2R4d+/jKmn8Bc5+hgDsqAewsDfrGdszx68likm5F6Gc4sDfexyt 


RfdS10juHgbcfDssWe7/K=1KhnMikLo0+1/BvcxX4t==Ujk9PbcD4 
Thdf2awOfgHbnmKlok8iy6gThlp 
END PGP MESSAGE 





图 8-23 一 个 秘密 PGP 报 文 


PGP 也 提供 了 一 种 公 钥 认证 机 制 ， 但 是 这 种 机 制 与 更 为 传统 的 CA 差异 很 大 。PGP 公 
钥 由 一 个 可 信 Web 验证 。 当 Alice 相信 一 个 密 钥 / 用 户 名 对 确实 匹配 时 ， 她 自己 就 可 以 验 
证 这 一 密 钥 /用 户 名 对 。 此 外 ，PGP 允许 Alice 为 她 所 信任 的 用 户 鉴别 更 多 密 钥 提 供 担保 。 
一 些 PGP 用 户 通过 保持 密 钥 签署 方 (key-signing party) 互相 签署 对 方 的 密 钥 。 用 户 实际 走 
到 一 起 ， 交 换 公 钥 ， 并 用 自己 的 私 钥 对 对 方 的 公 钥 签名 来 互相 验证 密 钥 。 


8.6 使 TCP 连接 安全 : SSL 


在 前 一 节 中 ， 我 们 看 到 对 一 个 特定 的 应 用 〈 即 电子 邮件 ) ， 密 码 技术 是 怎样 提供 机 密 
性 、 数 据 完整 性 和 端点 鉴别 的 。 在 这 一 节 中 ， 我 们 在 协议 栈 中 向 下 一 层 ， 考 察 密码 技术 如 
何 用 安全 性 服务 加 强 TCP, 该 安全 性 服务 包括 机 密 性 、 数 据 完整 性 和 端点 鉴别 。TCP 的 这 
种 强化 版 本 通常 被 称 为 安全 套 接 字 层 (Secure Socket Layer, SSL). SSL 版 本 3 的 一 个 稍 加 
修改 的 版 本 被 称 为 运输 层 安 全 性 (Transport Layer Security，TLS) ， 已 经 由 IETF 标准 化 
[RFC 4346], 

SSL 最 初 由 Netscape 设计 ， 而 使 TCP 安全 隐 含 的 基本 思想 先 于 Netscape 的 工作 ( fil 
如 ， BIL [Woo 1994] ) 。 由 于 SSL 的 岂 露 头角 ， 它 已 经 得 到 了 广泛 部 署 。SSL 得 到 了 所 有 
流行 Web 浏览 器 和 Web 服务 器 的 支持 ， 并 基本 上 被 用 于 所 有 因特网 商业 站 点 (包括 Ama- 
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zon, eBay, Yahoo!, MSN 等 等 ) 。 每 年 经 SSL 花费 了 数 百 亿美 元 。 事 实 上， 如 果 你 使 用 信 
用 卡通 过 因特网 购买 任何 东西 的 话 ， 在 你 的 浏览 器 和 服务 器 之 间 的 通信 几乎 一 定 使 用 了 
SSL, ( 当 你 使 用 浏览 器 时 ， 若 URL 以 https: 开始 而 不 是 以 http 开始 ， 就 能 认定 正在 使 
用 SSL。) 
为 了 理解 SSL 的 需求 ,我 们 浏览 一 下 某 典 型 的 因特网 商业 的 场景 。Bob 在 Web Enp 
浪 ， 到 达 了 Alice 公司 的 站 点 ， 这 个 站 点 正在 出 售 香 水 。Alice 公司 站 点 显示 了 一 个 表格 ， 
假定 Bob 可 以 在 该 表格 中 输入 香水 的 类 型 和 所 希望 的 数量 、 他 的 地 址 和 他 的 支付 卡号 等 信 
息 。Bob 输入 这 些 信息 ， 点 击 “ 提 交 ”， 就 期 待 收 到 (通过 普通 邮政 邮件 ) 所 购买 的 香水 ; 
他 也 期 待 着 在 他 的 下 一 次 支付 卡 报表 中 收 到 对 所 购物 品 的 支付 信息 。 所 有 这 一 切 听 起 来 不 
错 ,， 但 是 如 果 不 采取 安全 措施 ，Bob 也 许 会 有 一 些 意外 。 
。 如 果 没 有 使 用 机 密 性 (加密 )， 一 个 人 侵 者 可 能 截取 Bob 的 订单 并 得 到 他 的 支付 卡 
信息 。 这 个 人 侵 者 则 可 以 用 Bob 的 费用 来 购买 商品 。 
© 如 果 没 有 使 用 完整 性 ， 入 侵 者 可 能 修改 Bob 的 订单 ， 让 他 购买 比 希望 瓶 数 多 10 售 
的 香水 。 
。 最 后 ， 如 果 没 有 使 用 服务 器 鉴别 ， 这 个 显示 Alice 公司 著名 徽标 的 服务 器 实际 上 是 
由 Trudy 维护 的 一 个 站 点 ，Trudy 正在 假冒 Alice 公司 。 当 Trudy 收 到 Bob 的 订单 
后 ， 可 能 拿 了 Bob 的 钱 一 走 了 之 。 或 者 Trudy 可 能 充当 一 名 身份 窃贼 ， 收 集 Bob 
的 名 字 、 地 址 和 信用 卡号 。 
SSL 通过 采用 机 密 性 、 数 据 完 整 性 、 服 务 器 鉴别 和 客户 鉴别 来 强化 TCP， 就 可 以 解决 
这 些 问题 。 
SSL 经 常用 来 为 发 生 在 HTTP 之 上 的 事务 提供 安全 性 。 然 而 ， 因 为 SSL 使 TCP 安全 
了 ， 因 此 它 能 被 应 用 于 运行 在 TCP 之 上 的 任 
何 应 用 程序 。SSL 提供 了 一 个 简单 的 具有 套 接 | 
字 的 应 用 编程 接口 (API)， 该 接口 类 似 于 
TCP 的 API。 当 一 个 应 用 程序 要 使 用 SSL 时 ， 
它 包 括 了 SSL 类 / 库 。 如 在 图 8-24 中 所 示 ， 尽 
管 SSL 技术 上 位 于 应 用 层 中 , 但 从 研发 者 的 
角度 看 ， 它 是 一 个 提供 TCP 服务 的 运输 协议 , TCP API 用 SSL 加 强 的 TCP 
而 这 里 的 TCP REMEEHEREIMET mga 尽管 从 SSL 技术 上 看 位 于 应 用 层 中 ， 但 从 


8.6.1 宏观 描述 研发 者 的 角度 看 它 是 一 个 运输 层 协议 





我 们 从 描述 一 个 简化 的 SSL 版 本 开始 ， 这 将 使 我 们 从 宏观 上 理解 SSL 的 工作 原理 和 
工作 过 程 。 我 们 将 这 个 SSL 的 简化 版 本 称 之 为 “类 SSL”。 描 述 过 类 SSL 之 后 ， 在 下 一 
小 节 中 我 们 将 描述 真实 的 SSL， 填 充 细节 。 类 SSL (A SSL) 具有 三 个 阶段 : HF. FB 
钥 导 出 和 数据 传输 。 我 们 现在 描述 针对 一 个 客户 (Bob) 和 一 个 服务 器 (Alice) 之 间 的 
通信 会 话 的 这 三 个 阶段 ， 其 中 Alice 具有 私 钥 / 公 钥 对 和 将 她 的 身份 与 其 公 钥 绑 定 的 
证 书 。 

1. 握手 

在 握手 阶段 ，Bob 需要 : OF Alice 创建 一 条 TCP HEH; @@ 验 证 Alice 是 真实 的 Alice; 
DRI Alice 一 个 主 密 钥 ，Bob 和 Alice 持 用 该 主 密 钥 生成 SSL 会 话 所 需 的 所 有 对 称 密 
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钥 。 这 三 个 步骤 显示 在 图 8-25 中 。 注 意 到 一 旦 创建 了 TCP EH, Bob 就 向 Alice 发 送 一 个 
hello 报 文 。Alice 则 用 她 的 证 书 进行 响应 ， 证 书 中 包含 了 她 的 公 钥 。 如 在 8. 3 节 所 讨论 ， 
因为 该 证 书 已 被 某 CA 证 实 过 ，Bob 明白 无 误 地 知道 该 公 钥 属于 Alice。 然 后 ，Bob 产生 一 
个 主 密 钥 (MS) (该 MS 将 仅 用 于 这 个 SSL 会 话 ) Al Alice 的 公 钥 加 密 该 MS 以 生成 加 密 
的 主 密 钥 (EMS) ， 并 将 该 EMS 发 送 给 

Alice, Alice 用 她 的 私 钥 解密 该 EMS 从 . 

而 得 到 该 MS。 在 这 个 阶段 后 ，Bob 和 em ’ 

Alice (而 无 别 的 人 ) 均 知 道 了 用 于 这 次 


SSL 会 话 的 主 密 钥 。 "| 一 TCPISYNASS 
2. 密 钥 导出 TCPACK 


从 原则 上 讲 ，MS 此 时 已 由 Bob 和 me 
Alice 共享 ， 它 能 够 用 作 所 有 后 继 加 密 和 soe 
BE Te EE RAE OAT Pk. A 
而 ,对 于 Alice 和 Bob 每 人 而 言 ， 使 用 of: : 
不 同 的 密码 密 铀 ， 并 且 对 于 加 密 和 完整 arre i 
性 检查 也 使 用 不 同 的 密 铀 ， 通 常 认为 更 Ms) ， ; fas 


为 安全 。 因 此 ，Alice 和 Bob 都 使 用 MS 图 8-25 类 SSL 握手, 首先 建立 一 个 TCP 连接 
生成 4 个 密 钥 : 

© E, HTM Bob 发 送 到 Alice 的 数据 的 会 话 加 密 密 钥 

。 M;， 用 于 从 Bob 发 送 到 Alice 的 数据 的 会 话 MAC HH 

© E,, FAFM Alice 发 送 到 Bob 的 数据 的 会 话 加 密 密 钥 

e M,, HFA Alice 发 送 到 Bob 的 数据 的 会 话 MAC 密 钥 

Alice 和 Bob 每 人 都 从 MS 生成 4 oe 这 能 够 通过 直接 将 该 MS 分 为 4 个 密 钥 来 实 
现 。 (但 在 真实 的 SL 中 更 为 复杂 一 些 ， 我 们 后 面 将 会 看 到 。) 在 密 钥 导 出 阶段 结束 时 ， 
Alice 和 Bob 都 有 了 4 个 密 钥 。 其 中 a eA 两 个 MAC 密 钥 将 用 
于 验证 数据 的 完整 性 。 

3. 数据 传输 

既然 Alice 和 Bob 共享 相同 的 4 ARH (Ep, Mp, Ea 和 M)， 他 们 就 能 够 经 TCP 
连接 开始 发 送 安全 的 数据 。 因 为 TCP 是 一 种 字 节 流 协议 ， 一 种 自然 的 方法 是 用 SSL 在 传输 
中 加 密 应 用 数据 ， 然 后 将 加 密 的 数据 在 传输 中 传 给 TCP。 但 是 如 果 我 们 真 的 这 样 做 ,我们 
将 用 于 完整 性 检查 的 MAC 置 于 何 处 呢 ? 我 们 无 疑 不 希望 等 到 TCP 会 话 结束 时 才 验 证 所 有 
Bob 数据 的 完整 性 ，Bob 数据 的 发 送 要 经 历 整个 会 话 ! 为 了 解决 这 个 问题 ，SSL 将 数据 流 
分 割 成 记录 ， 对 每 个 记录 附加 一 个 MAC 用 于 完整 性 检查 ， 然 后 加 密 该 “记录 + MAC”。 为 
了 产生 这 个 MAC，Bob 将 数据 连同 密 钥 Ms 放 和 一 个 散 列 函数 中 ， 如 在 8.3 节 所 讨论 。 为 
了 加 密 “ 记 录 +MAC” 这 个 包 ，Bob 使 用 他 的 会 话 加 密 密 钥 E;。 然 后 这 个 加 密 的 包 将 传 
递 给 TCP 经 因特网 传输 。 

虽然 这 种 方法 几经 周折 ， 但 它 为 整个 报 文 流 提供 数据 完整 性 时 仍 未 达到 无 懈 可 击 。 特 
IÆ, BÆ Trudy 是 一 名 “中 间 人 ”， 并 且 有 在 Alice 和 Bob 之 间 发 送 的 TCP 报 文 段 流 中 插 
人、 删除 和 代替 报 文 段 的 能 力 。 例 如 ，Trudy 能 够 俘获 由 Bob RIMM THRICE, MIX 
两 个 报 文 段 的 次 序 ， 调 整 TCP 报 文 段 的 序号 (这 些 未 被 加 密 ) ， 然 后 将 这 两 个 次 序 翻转 的 
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报 文 段 发 送 给 Alice, (RET TCP 报 文 段 正好 封装 了 一 个 记录 ， 我 们 现在 看 看 Alice 将 如 
何 处 理 这 些 报 文 段 。 

1) Æ Alice 端 运 行 的 TCP 将 认为 一 切 正 常 ， 将 这 两 个 记录 传递 给 SSL F. 

2) 在 Alice 端的 SSL 将 解密 这 两 个 记录 。 

3) 在 Alice 端的 SSL 将 使 用 在 每 个 记录 中 的 MAC 来 验证 这 两 个 记录 的 数据 完整 性 。 

4) 然后 SSL 将 解密 的 两 条 记录 的 字 节 流传 递 给 应 用 层 ; 但 是 Alice 收 到 的 完整 字 节 流 
由 于 记录 的 颠倒 而 次 序 不 正确 ! 

鼓励 读者 观察 类 似 的 场景 ， 如 当 Trudy 删除 报 文 段 或 当 Trudy 重 放 报 文 段 时 。 

对 该 问题 的 解决 方案 如 你 可 能 猜想 的 那样 ， 那 就 是 使 用 序号 。SSL 采用 如 下 的 方式 。 
Bob 维护 一 个 序号 计数 器 ， 计 数 器 开始 为 0，Bob 每 发 送 的 一 个 SSL 记录 它 都 增加 1。Bob 
并 不 实际 在 记录 中 包括 一 个 序号 , 但 当 他 计算 MAC 时 ， 他 把 该 序号 包括 在 MAC 的 计算 
中 。 所 以 ， 该 MAC 现在 是 数据 加 MAC 密 钥 M, 加 当前 序号 的 散 列 。Alice 跟踪 Bob 的 序 
号 ， 通 过 在 MAC 的 计算 中 包括 适当 的 序号 ， 使 她 验证 一 条 记录 的 数据 完整 性 。SSL 序号 
的 使 用 阻止 了 Trudy 执行 诸如 重 排序 或 重 放 报 文 段 等 中 间 大 攻击 。 (为 什么 ?) 

4. SSL 记录 


SSL 记录 (以 及 类 SSL 记录 ) 显示 在 图 8-26 中 。 该 记录 由 类 型 字段 、 版 本 字段 、 
长 度 字 段 、 数 据 字 段 和 MAC 字段 组 成 。 注 意 到 前 三 个 字段 是 不 加 密 的 。 类 型 字段 指出 
了 该 字段 是 握手 报 文 还 是 包含 应 用 数据 的 报 文 。 它 也 用 于 关闭 SSL 连接 ， 如 下 面 所 讨 
论 。 在 接收 端的 SSL 使 用 长 度 字 段 以 从 到 达 的 TCP 字 节 流 中 提取 SSL 记录 。 版 本 字段 是 


自 解释 的 。 
«PM A nl A, 
Pd 


AE, 
图 8-26 SSL 记录 格式 


8. 6.2 更 完整 的 描述 


前 一 小 节 涉及 了 类 SSL 协议 ; 其 目的 是 让 我 们 对 SSL 的 工作 原理 和 工作 过 程 有 一 个 基 
本 理解 。 既 然 我 们 已 经 对 SSL 有 了 基本 了 解 ， 就 能 够 更 深入 地 研究 实际 SSL 协议 的 要 点 
了 。 为 了 配合 阅读 对 SSL 协议 的 描述 ， 鼓 励 读 者 完成 Wireshark SSL 实验 ， 它 在 本 书 配 套 
的 Web 网 站 上 可 供 使 用 。 

1. SSL 握手 

SSL 并 不 强制 Alice 和 Bob 使 用 一 种 特定 的 对 称 密 钥 算法 、 一 种 特定 的 公 钥 算法 或 一 
种 特定 的 MAC。 相 反 ，SSL 允许 Alice 和 Bob 在 握手 阶段 在 SSL 会 话 开 始 时 就 密码 算法 取 
得 一 致 。 此 外 ， 在 握手 阶段 ，Alice 和 Bob 彼此 发 送 不 重 数 ,该 数 被 用 于 会 话 密 钥 (EE，， 
M,, E,#1M,) 的 生成 中 。 真 正 的 SSL 握手 的 步骤 如 下 : 

1) 客户 发 送 它 支持 的 密码 算法 的 列表 ， 连 同一 个 客户 的 不 重 数 。 

2) 从 该 列表 中 ， 服 务 器 选择 一 种 对 称 算法 (例如 AES)、 一 种 公 钥 算法 (例如 有 具有 
特定 密 钥 长 度 的 RSA) 和 一 种 MAC 算法 。 它 把 它 的 选择 以 及 证 书 和 一 个 服务 器 不 重 数 返 
回 给 客户 。 
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3) 客户 验证 该 证 书 ， 提 取 服 务 器 的 公 钥 ， 生 成 一 个 前 主 密 钥 (Pre- Master Secret, 
PMS) ， 用 服务 器 的 公 钥 加 密 该 PMS， 并 将 加 密 的 PMS 发 送 给 服务 器 。 

4) 使 用 相同 的 密 钥 导出 函数 (就 像 SSL 标准 定义 的 那样 ) ， 客 户 和 服务 器 独立 地 从 
PMS 和 不 重 数 中 计算 出 主 密 钥 (Master Secret, MS), JAA MS 被 切片 以 生成 两 个 密码 和 
两 个 MAC 密 钥 。 此 外 ， 当 选择 的 对 称 密码 应 用 于 CBC (例如 3DES 或 AES) ， 则 两 个 初始 
化 向 量 (Initialization Vector, IV) 也 从 该 MS 获得 ， 这 两 个 TV 分 别 用 于 该 连接 的 两 端 。 自 
此 以 后 ， 客 户 和 服务 器 之 间 发 送 的 所 有 报 文 均 被 加 密 和 鉴别 (使 用 MAC) 。 

5) 客户 发 送 所 有 握手 报 文 的 一 个 MAC。 

6) 服务 器 发 送 所 有 握手 报 文 的 一 个 MAC。 

最 后 两 个 步骤 使 握手 免 受 算 改 危害 。 为 了 理解 这 一 点 ， 观 察 在 第 一 步 中 ， 客 户 通常 提 
供 一 个 算法 列表 ， 其 中 有 些 算法 强 ， 有 些 算法 弱 。 因 为 这 些 加 密 算法 和 密 钥 还 没有 被 协商 
好 ， 所 以 算法 的 这 张 列表 以 明文 形式 发 送 。Trudy 作为 中 间 人 ， 能 够 从 列表 中 删除 较 强 的 
算法 ， 迫 使 客户 选择 一 种 较 弱 的 算法 。 为 了 防止 这 种 自 改 攻击 ， 在 步骤 5 中 客户 发 送 一 个 
级 联 它 已 发 送 和 接收 的 所 有 握手 报 文 的 MAC。 服 务 器 能 够 比较 这 个 MAC 与 它 已 接收 和 发 
送 的 握手 报 文 的 MAC。 如 果 有 不 一 致 ， 服 务 器 能 够 终止 该 连接 。 类 似 地 ， 服 务 器 发 送 一 
个 它 已 经 看 到 的 握手 报 文 的 MAC， 人 允许 客户 检查 不 一 致 性 。 

你 可 能 想 知道 在 步骤 1 和 步骤 2 中 存在 不 重 数 的 原因 。 序 号 不 足以 防止 报 文 段 重 放 攻 
击 吗 ? 答案 是 肯定 的 ， 但 它们 并 不 只 是 防止 “连接 重 放 攻 击 ”。 考 虑 下 列 连接 重 放 攻 击 。 
假设 Trudy 嗅 探 了 Alice 和 Bob 之 间 的 所 有 报 文 。 第 二 天 ，Trudy 冒充 Bob 并 向 Alice AIK 
正好 是 前 一 天 Bob 向 Alice 发 送 的 相同 的 报 文 序列 。 如 果 Alice 没有 使 用 不 重 数 ， 她 将 以 前 
一 天 发 送 的 完全 相同 的 序列 报 文 进行 响应 。Alice 将 不 怀疑 任何 不 规矩 的 事 ， 因 为 她 接收 
到 的 每 个 报 文 将 通过 完整 性 检查 。 如 果 Alice 是 一 个 电子 商务 服务 器 ， 她 将 认为 Bob 正在 
进行 第 二 次 订购 (正好 订购 相同 的 东西 )。 在 另 一 方面 ， 在 协议 中 包括 了 一 个 不 重 数 ， 
Alice 将 对 每 个 TCP 会 话 发 送 不 同 的 不 重 数 ， 使 得 这 两 天 的 加 密 密 钥 不 同 。 因 此 ， 当 Alice 
接收 到 来 自 Trudy HAH SSL 记录 时 ,该 记录 将 无 法 通过 完整 性 检查 ， 并 且 假 冒 的 电子 商 
务 事务 将 不 会 成 功 。 总 而 言 之 ,在 SSL 中 ， 不 重 数 用 于 防御 “连接 重 放 ”， 而 序号 用 于 防 
御 在 一 个 进行 中 的 会 话 中 重 放 个 别 分 组 。 

2. 连接 关闭 

在 某 个 时 刻 ，Bob 或 者 Alice 将 要 终止 SSL 会 话 。 一 个 方法 是 让 Bob 通过 直接 终止 底 
层 的 TCP 连接 来 结束 该 SSL 会 话 ， 这 就 是 说 ， 通 过 让 Bob 向 Alice 发 送 一 个 TCP FIN 报 文 
段 。 但 是 这 种 幼稚 设计 为 截断 攻击 (truncation attack) 创造 了 条 件 ，Trudy 再 一 次 介入 一 
个 进行 中 的 SSL 会 话 中 ， 并 用 TCP FIN 过 早 地 结束 了 该 会 话 。 如 果 Trudy 这 样 做 的 话 ， 
Alice 将 会 认为 她 收 到 了 Bob 的 所 有 数据 ， 而 实际 上 她 仅 收 到 了 其 中 的 一 部 分 。 对 这 个 问 
题 的 解决 方法 是 ， 在 类 型 字段 中 指出 该 记录 是 否 是 用 于 终止 该 SSL 会 话 的 。( 尽管 SSL 类 
型 是 以 明文 形式 发 送 的 ， 但 在 接收 方 使 用 了 记录 的 MAC 对 它 进行 了 鉴别 。) 通过 包括 这 样 
一 个 字段 ， 如 果 Alice 在 收 到 一 个 关闭 SSL 记录 之 前 突然 收 到 了 一 个 TCP FIN， 她 可 能 知 
道 正在 进行 着 某 些 夏 花招 的 事情 。 

到 此 为 止 完成 了 对 SSL 的 介绍 。 我 们 已 经 看 到 它 使 用 了 在 8.2 节 和 8.3 节 讨 论 的 许多 
密码 学 原则 。 和 希望 更 深入 地 探讨 SSL 的 读者 可 以 阅读 Rescorla 的 有 关 SSL 的 可 读 性 很 强 的 
书籍 [ Rescorla 2001 | 。 
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8.7 网 络 层 安全 性 : IPsec 和 虚拟 专用 网 


IP 安全 (IP Security) 协议 更 常 被 称 为 IPsec， 它 为 网 络 层 提供 了 安全 性 。IPsec 为 任 
意 两 个 网 络 层 实体 ( 包 插 主机 和 路 由 器 ) ZI IP 数据 报 提 供 了 安全 。 如 我 们 很 快要 描 
述 的 那样 ， 许 多 机 构 (公司 、 政 府 部 门 、 非 营利 组 织 等 等 ) 使 用 IPsec 创建 了 运行 在 公共 
因特网 之 上 的 虚拟 专用 网 (Virtual Private Network, VPN), 

在 学 习 IPsec 细节 之 前 ， 我 们 后退 一 步 来 考虑 为 网 络 层 提供 机 密 性 所 包含 的 意义 。 在 
网 络 实体 对 之 间 〈 例 如 ， 两 台 路 由 器 之 间 ， 两 台 主机 之 间 ， 或 者 路 由 器 和 主机 之 间 ) 具有 
网 络 层 机 密 性 ， 发 送 实体 加 密 它 发 送 给 接收 实体 的 所 有 数据 报 的 载荷 。 这 种 载荷 可 以 是 一 
个 TCP 报 文 段 、 一 个 UDP 报 文 段 、 一 个 ICMP 报 文 等 等 。 如 果 这 样 的 网 络 层 服务 适当 的 
话 ， 从 一 个 实体 向 其 他 实体 发 送 的 所 有 数据 报 将 隐形 于 任何 可 能 嗅 探 该 网 络 的 第 三 方 ， 发 
送 的 数据 报 包 括 电子 邮件 、Web 网 页 、TCP 握手 报 文 和 管理 报 文 (例如 ICMP 和 SNMP) 。 
正 因为 如 此 ， 网 络 层 安全 性 被 认为 提供 了 “地 毯 覆盖 ”。 

除了 机 密 性 ， 网 络 层 安 全 协议 潜在 地 能 够 提供 其 他 安全 性 服务 。 例 如 ， 它 能 提供 源 鉴 
别 ， 使 得 接收 实体 能 够 验证 安全 数据 报 的 源 。 网 络 层 安全 协议 能 够 提供 数据 完整 性 ， 使 得 
接收 实体 能 够 核对 在 数据 报 传输 过 程 中 可 能 出 现 的 任何 自 改 。 网 络 层 安全 服务 也 能 提供 防 
止 重 放 攻 击 功能 ， 这 意味 着 Bob 能 够 检测 任何 攻击 者 可 能 插入 的 任何 元 余数 据 报 。 我 们 将 
很 快 看 到 IPsec 的 确 提 供 了 用 于 这 些 安全 服务 的 机 制 ， 即 机 密 性 、 源 鉴别 、 数 据 完整 性 和 
重 放 攻 击 防 护 。 


8.7.1 IPsec 和 虚拟 专用 网 


跨越 在 多 个 地 理 区 域 上 的 某 机 构 常 常 希望 有 自己 的 IP 网络 ， 使 它 的 主机 和 服务 器 能 
够 以 一 种 安全 和 机 密 的 方式 彼此 发 送 数 据 。 为 了 达到 这 个 目标 ， 该 机 构 能 够 实际 部 署 一 个 
单独 的 物理 网 络 ， 该 网 络 包括 路 由 器 、 链 路 和 DNS 基础 设施 且 与 公共 因特网 完全 分 离 。 
这 样 一 种 为 特定 的 机 构 专 用 的 分 立 网 络 被 称 为 专用 网 络 〈private network ) 。 毫 不 奇怪 ， 专 
用 网 络 可 能 耗资 巨大 ， 因 为 该 机 构 需 要 购买 、 安 装 和 维护 它 自己 的 物理 网 络 基础 设施 。 

不 同 于 部 署 和 维护 一 个 专用 网 络 ， 如 今 许 多 机 构 在 现 有 的 公共 因特网 上 创建 VPN。 使 
用 VPN， 机 构 办 公 室 之 间 的 流量 经 公共 因特网 而 不 是 经 物理 上 独立 的 网 络 发 送 。 而 为 了 提 
供 机 密 性 ， 办 公 室 之 间 的 流量 在 进入 公共 因特网 之 前 进行 加 密 。 图 8-27 中 显示 了 VPN 的 
一 个 简单 例子 。 这 里 的 机 构 由 一 个 总 部 、 一 个 分 支 机 构 和 旅行 中 的 销售 员 组 成 ,销售 员 通 
常 从 他 们 的 旅馆 房间 接 人 因特网 。 (在 该 图 中 仅 显示 了 一 名 销售 员 。) 在 这 个 VPN 中 , 无 
论 何 时 ， 位 于 总 部 的 两 台 主 机 相互 发 送 IP 数据 报 或 位 于 分 支 机 构 的 两 台 主 机 要 通信 ， 它 
们 都 使 用 经 典 的 IPv4 (EIE IPsec 服务 ) 。 然 而 ， 当 两 台 机 构 的 主机 经 过 跨越 公共 因特网 
的 路 径 时 ， 这 些 流量 在 进入 因特网 之 前 进行 加 密 。 

为 了 感受 VPN 的 工作 过 程 ， 我 们 浏览 图 8-27 场景 中 的 一 个 简单 例子 。 当 总 部 中 的 一 
台 主 机 向 某 旅馆 中 的 某 销 售 员 发 送 一 个 P 数据 报时 ， 总 部 中 的 网 关 路 由 器 将 经 典 的 IPv4 
转换 成 为 IPsece 数据 报 ， 然 后 将 该 IPsec 数据 报 转发 进 因 特 网 。 该 IPsec 数据 报 实 际 上 具有 
传统 的 IPv4 首部 ， 因 此 在 公共 因特网 中 的 路 由 器 处 理 该 数据 报 ， 仿 佛 它 对 路 由 器 而 言 是 
一 个 普通 的 IPv4 数据 报 。 但 是 如 图 8-27 所 示 ，IPsec 数据 报 的 载荷 包括 了 一 个 IPsec 首部 ， 
该 首部 被 用 于 IPsec 处 理 ; 此 外 ，IPsec 数据 报 的 载荷 是 被 加 密 的 。 当 该 IPsec 数据 报到 达 
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销售 员 的 便携 机 时 ， 便 携 机 的 操作 系统 解密 载荷 〈 并 提供 其 他 安全 服务 ， 如 验证 数据 完整 
性 ) ， 并 将 解密 的 载荷 传递 给 上 层 协议 〈 例 如 , 给 TCP 或 UDP) 。 


具有 IPsec 的 便携 机 





图 8-27 虚拟 专用 网 


我 们 刚刚 给 出 了 某 机 构 能 够 应 用 IPsec 生成 一 个 VPN 的 高 层面 的 展望 。 为 了 通过 局 部 
看 全 局 ， 我 们 已 经 去 掉 了 许多 重要 的 细节 。 现 在 我 们 来 进行 更 深入 的 学 习 。 


8.7.2 AH 协议 和 ESP 协议 


IPsec 是 一 个 相当 复杂 的 整体 ， 即 它 被 定义 为 10 多 个 RFC 文档 。 两 个 重要 的 文档 是 
RFC 4301 和 RFC 6071， 前 者 描述 了 总 体 IP 安全 体系 结构 ， 后 者 提供 了 一 个 IPsec 协议 集 
的 概述 。 在 本 教科 书 中 我 们 的 目标 与 往常 一 样 ， 并 不 只 是 一 味 重复 枯燥 和 星 涩 难 解 的 RFC 
文档 ， 而 是 采用 一 种 更 具 可 操作 性 和 易于 教学 的 方法 来 描述 协议 。 

在 IPsec 协议 族 中 ， 有 两 个 主要 协议 : 鉴别 首部 (Authentication Header, AH) 协议 和 
封装 安全 性 载荷 (Encapsulation Security Payload, ESP) 协议 。 当 某 源 IPsec 实体 (通常 是 
一 台 主 机 或 路 由 器 ) 向 一 个 目的 实体 (通常 也 是 一 台 主 机 或 路 由 器 ) 发 送 安全 数据 报时 ， 
它 可 以 使 用 AH 协议 或 ESP 协议 来 做 到 。AH 协议 提供 源 鉴 别 和 数据 完整 性 服务 ， 但 不 提 
供 机 密 性 服务 。ESP 协议 提供 了 源 鉴 别 、 数 据 完整 性 和 机 密 性 服务 。 因 为 机 密 性 通常 对 
VPN 和 其 他 IPsec 应 用 是 至 关 重 要 的 ， 所 以 ESP 协议 的 使 用 比 AH 协议 要 广泛 得 多 。 为 了 
讲 清 IPsec 并 且 避 免 许多 难题 ， 我 们 将 此 后 专门 关注 ESP 协议 。 鼓 励 还 想 学 习 AH 协议 的 
读者 研讨 相关 的 RFC 和 其 他 在 线 资源 。 


8.7.3 安全 关联 


IPsec 数据 报 在 网 络 实体 对 之 间 发 送 ， 例 如 两 台 主机 之 间 、 两 台 路 由 器 之 间或 一 台 主 
机 和 一 台 路 由 器 之 间 。 在 从 源 实体 向 目的 实体 发 送 IPsec 数据 报 之 前 ， 源 和 目的 实体 创建 
了 一 个 网 络 层 的 逻辑 连接 。 这 个 逻辑 连接 称 为 安全 关联 (Security Association，SA) 。 一 个 
SA 是 一 个 单 工 逻辑 连接 ; 也 就 是 说 ， 它 是 从 源 到 目的 地 单 向 的 。 如 果 两 个 实体 要 互相 发 
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送 安全 数据 报 ， 则 需 创 建 两 个 SA， 每 个 方向 一 个 。 

例如 ， 再 次 考虑 图 8-27 中 那个 机 构 的 VPN。 该 机 构 由 一 个 总 部 、 一 个 分 支 机 构 入 n 
个 旅行 销售 员 组 成 。 为 了 举例 的 缘故 ,我 们 假设 在 总 部 和 分 支 机 构 之 间 有 双向 IPsec 流量 ， 
并 且 总 部 和 销售 员 之 间 也 有 双向 IPsee 流量 。 在 这 个 VPN 中 ， 有 多 少 个 SA WE? 为 了 回答 
这 个 问题 ， 注 意 到 在 总 部 网 关 路 由 器 和 分 支 机 构 网 关 路 由 器 之 间 有 两 个 SA (一 个 方向 一 
个 ) ;对 每 个 销售 员 的 便携 机 而 言 ， 在 总 部 网 关 和 便携 机 之 间 有 两 个 SA 〈 仍 是 一 个 方向 一 
个 )。 因 此 ， 总计 为 (2 +2n) 个 SA。 然 而 记 住 ， 并 非 从 网 关 路 由 器 或 便携 机 发 送 进 因 特 
网 的 所 有 流量 都 将 是 IPsec 安全 的 。 例 如 ， 总 部 中 的 一 台 主机 可 能 要 访问 公共 因特网 中 的 
某 Web 服务 器 (例如 Amazon 或 谷歌 ) 。 因 此 ， 该 网 关 路 由 器 〈 或 该 便携 机 ) 将 发 送 经 典 
的 IPv4 数据 报 和 安全 的 IPsec 数据 报 进入 因特网 。 
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图 8-28 WRI 到 R2 的 安全 关联 


我 们 现在 观察 SA 的 “内 部 ”。 为 了 使 讨论 明确 和 具体 ， 我 们 在 图 8-28 中 的 一 个 从 路 
由 器 RI 到 路 由 器 R2 的 SA 场景 下 进行 观察 。( 你 能 够 认为 路 由 器 RI 是 图 8-27 中 的 总 部 
网 关 路 由 器 ， 而 路 由 器 R2 是 图 8-27 中 的 分 支 机 构 网 关 路 由 器 。) 路 由 器 R1 将 维护 有 关 该 
SA 的 状态 信息 ， 这 将 包括 : 

© SA 的 32 比特 的 标识 符 ， 称 为 安全 参数 索引 (Security Parameter Index, SPI), 

e SA 的 初始 接口 (在 此 例 中 为 200. 168.1.100) 和 SA 的 目的 接口 (在 此 例 中 为 
193. 68. 2. 23), 

将 使 用 的 加 密 类 型 (例如 ， 具 有 CBC 的 3DES) 。 
加 密 密 钥 。 
完整 性 检查 的 类 型 (例如 ， 具 有 MDS 的 HMAC), 

。 鉴别 密 钥 。 

无 论 何 时 路 由 器 RI 需要 构建 一 个 IPsec 数据 报 经 过 这 个 SA 转发 ， 它 访问 该 状态 信息 
以 决定 它 应 当 如 何 鉴别 和 加 密 该 数据 报 。 类 似 地 ， 路 由 器 R2 将 维护 对 此 SA 的 相同 的 状 
态 信 息 ， 并 将 使 用 该 信息 鉴别 和 加 密 任何 从 该 SA 到 达 的 IPsec 数据 报 。 

一 个 IPsec 实体 (路 由 器 或 主机 ) 经 常 维护 许多 SA 的 状态 信息 。 例 如 ， 在 图 8-27 中 
具有 个 销售 员 的 VPN 例子 中 ， 总 部 网 关 路 由 器 维护 (2 +2n) 个 SA 的 状态 信息 。 一 个 
IPsec 实体 在 它 的 安全 关联 数据 库 (Security Association Database, SAD) 中 存储 其 所 有 SA 
的 状态 信息 ，SAD 是 实体 操作 系统 内 核 中 的 一 个 数据 结构 。 


8.7.4 IPsec 数据 报 


在 描述 了 SA 后 ,我 们 现在 能 够 描述 实际 的 IPsec 数据 报 了 。IPsee 有 两 种 不 同 的 分 组 
形式 , 一 种 用 于 所 请 隧道 模式 (tunnel mode)， 另 一 种 用 于 所 谓 运 输 模式 (transport 
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mode) 。 更 为 适合 VPN 的 隧道 模式 比 运输 模式 部 署 得 更 为 广泛 。 为 了 进一步 讲 清 IPsec 和 
避免 许多 难题 ,我们 因此 专门 关注 隧道 模式 。 一 旦 已 经 牢 牢 地 掌握 了 隧道 模式 ， 应 当 能 够 
容易 地 自学 运输 模式 。 
IPsec 数据 报 的 分 组 格式 显示 在 图 8-29 中 。 你 也 许 认 为 分 组 格式 是 枯燥 乏味 的 ， 但 我 
们 将 很 快 看 到 IPsec 数据 报 实 际 上 学 起 来 像 美式 墨西哥 风味 (Tex-Mex) 美食 ! 我 们 考察 
图 8-28 的 场景 中 的 IPsec 字段 。 假 设 路 由 器 R1 接收 到 一 个 来 自主 机 172. 16. 1. 17 (在 总 部 
网 络 中 ) 的 普通 IPv4 数据 报 ， 该 分 组 的 目的 地 是 主机 172. 16. 2. 48 〈 在 分 支 机构 网 络 中 ) 。 
路 由 器 RI 使 用 下 列 方法 将 这 个 “普通 IPv4 数据 报 ” 转 换 成 一 个 IPsec 数据 报 : 
o 在 初始 IPv4 数据 报 〈 它 包括 初始 首部 字段 1) 后 面 附 上 一 个 “ESP 尾部 ” 字段 。 
© 使 用 算法 和 由 SA 规定 的 密 钥 加 密 该 结果 。 
。 在 这 个 加 密 量 的 前 面 附加 上 一 个 称 为 “ESP 首部 ”的 字段 ， 得 到 的 包 称 为 “enchi- 
lada”( 以 辣椒 调味 的 一 种 墨西哥 菜 。 一 一 译 者 注 ) 。 
。 使 用 算法 和 由 SA 规定 的 密 钥 生 成 一 个 覆盖 整个 enchilada 的 鉴别 MAC, 
e 该 MAC 附加 到 enchilada 的 后 面 形成 载荷 。 
。 最 后 ， 生 成 一 个 具有 所 有 经 典 IPv4 首部 字段 (通常 共 20 字 节 长 ) 的 全 新 全 首部 ， 
该 新 首部 附加 到 载荷 之 前 。 


被 鉴别 的 | enchilada” 





被 加 审 | 








图 8-29 IPsec 数据 报 格式 


注意 到 得 到 的 IPsec 数据 报 是 一 个 货真价实 的 IPv4 数据 报 ， 它 具有 传统 的 IPv4 首部 字 
段 后 跟 一 个 载荷 。 但 在 这 个 场合 ， 该 载荷 包含 一 个 ESP 首部 、 初 始 IP 数据 报 、 一 个 ESP 
尾部 和 一 个 ESP 鉴别 字段 (具有 加 密 的 初始 数据 报 和 ESP ÆR). eR IP 数据 报 具有 
源 IP 地 址 172. 16. 1. 17 和 目的 地 址 172. 16. 2. 48 。 因 为 IPsec 数据 报 包 括 了 该 初始 IP 数据 
报 ， 这 些 地 址 被 包含 和 被 加 密 作 为 [Psec 分 组 负载 的 组 成 部 分 。 但 是 在 新 IP 首部 中 的 源 和 
目的 地 IP 地 址 ， 即 在 IPsec 数据 报 的 最 左 侧 首部 又 该 如 何 处 理 呢 ? 如 你 所 猜测 ， 它 们 被 设 
置 为 位 于 隧道 两 个 端点 的 源 和 目的 地 路 由 器 接口 ， 也 就 是 200. 168. 1. 100 和 193. 68. 2. 23 。 
同时 ， 这 个 新 IPv4 首部 字段 中 的 协议 号 不 被 设置 为 TCP、UDP 或 SMTP， 而 是 设置 为 50， 
指示 这 是 一 个 使 用 ESP 协议 的 IPsec 数据 报 。 

在 R1 将 IPsec 数据 报 发 送 进 公共 因特网 之 后 ， 它 在 到 达 R 之 前 将 通过 许多 路 由 器 。 
这 些 路 由 器 中 的 每 个 将 处 理 该 数据 报 ， 就 像 它 是 一 个 普通 数据 报 一 样 ， 即 它们 被 完全 忘记 
这 样 的 事实 : 该 数据 报 正在 承载 IPsec 加 密 的 数据 。 对 于 这 些 公共 因特网 路 由 器 ， 因 为 在 
外 面 首部 中 的 目的 IP 地 址 是 R2 ， 所 以 该 数据 报 的 最 终 目的 地 是 R2 。 

在 考察 了 如 何 构造 一 个 IPsec 数据 报 的 例子 后 ， 我 们 现在 更 仔细 地 观察 enchilada 的 组 
成 。 我 们 看 到 在 图 8-29 中 的 ESP 尾部 由 三 个 字段 组 成 : 填充 、 填 充 长 度 和 下 一 个 首部 。 
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前 面 讲 过 块 密码 要 求 被 加 密 的 报 文 必须 为 块 长 度 的 整数 倍 。 使 用 填充 (由 无 意义 的 字 节 组 
成 ) ， 使 得 当 其 加 上 初始 数据 报 (连同 填充 长 度 字 段 和 下 一 个 首部 字段 ) 形成 的 “ 报 文 ” 
是 块 的 整数 倍 。 填 充 长 度 字 段 指 示 接 收 实体 插入 的 填充 是 多 少 (并 且 需 要 被 删除 )。 下 一 
个 首部 字段 指示 包含 在 载荷 数据 字段 中 数据 的 类 型 (例如 UDP) 。 载 荷 数据 (通常 是 初始 
IP 数据 报 ) 和 ESP 尾部 级 联 起 来 并 被 加 密 。 

附加 到 这 个 加 密 单 元 前 面 的 是 ESP 首部 ,该 首部 以 明文 发 送 ， 它 由 两 个 字段 组 成 : 
SPI 字段 和 序号 字段 。SPF 字段 指示 接收 实体 该 数据 报 属于 哪个 SA; 接收 实体 则 能 够 用 该 
SPI 索引 其 SAD 以 确定 适当 的 鉴别 /解密 算法 和 密 钥 。 序 号 字段 用 于 防御 重 放 攻 击 。 

发 送 实体 也 附加 一 个 鉴别 MAC。 如 前 所 述 ， 发 送 实体 跨越 整个 enchilada (由 ESP 首 
部 、 初 始 IP 数据 报 和 ESP 尾部 组 成 ， 即 具有 加 密 的 数据 报 和 尾部 ) 计算 一 个 MAC。 前 面 
讲 过 为 了 计算 一 个 MAC， 发 送 方 附加 一 个 秘密 MAC 密 钥 到 该 enchilada， 进 而 计算 该 结果 
的 一 个 固定 长 度 散 列 。 

当 R2 接收 到 IPsec 数据 报时 ，R2 看 到 该 数据 报 的 目的 IP 地 址 是 R2 自身 。R2 因此 处 
理 该 数据 报 。 因 为 协议 字段 (位 于 P 首部 最 左 侧 ) 是 50，R2 明白 应 当 对 该 数据 报 施 加 
IPsec ESP 处 理 。 第 一 ， 针 对 enchilada, R2 使 用 SPI 以 确定 该 数据 报 属于 哪个 SA。 第 二 ， 
它 计算 该 enchilada 的 MAC 并 且 验 证 该 MAC 与 在 ESP MAC 字段 中 的 值 一 致 。 如 果 两 者 一 
致 ， 它 知道 该 enchilada KA RI 并 且 未 被 自 改 。 第 三 ， 它 检查 序号 字段 以 验证 该 数据 报 是 
新 的 (并 且 不 是 重 放 的 数据 报 )。 第 四 ， 它 使 用 与 SA 关联 的 解密 算法 和 密 钥 解密 该 加 密 
单元 。 第 五 ， 它 删除 填充 并 抽取 初始 的 普通 中 报 文 。 最 后 ， 它 朝 着 其 最 终 目的 地 将 该 初 
始 数据 报 转发 进 分 支 机 构 网 络 。 这 个 一 种 多 么 复杂 的 秘诀 呀 ! 还 未 曾 有 人 声称 准备 并 破解 
enchilada 是 一 件 容易 的 事 ! 

实际 上 还 有 另 一 个 重要 的 细微 差别 需要 处 理 。 它 以 下 列 问题 为 中 心 : 当 R 从 位 于 总 
部 网 络 中 的 一 台 主 机 收 到 一 个 (未 加 密 的 ) 数据 报时 ， 并 且 该 数据 报 目的 地 为 总 部 以 外 的 
某 个 目的 全 地 址 ，R2 怎样 才能 知道 它 应 当 将 其 转换 为 一 个 IPsec 数据 报 呢 ?并 且 如 果 它 
由 IPsec 处 理 ，R1 如 何 知道 它 应 当 使 用 (在 其 SAD 中 的 许多 SA 中 ) 哪个 SA 来 构造 这 个 
IPsec 数据 报 呢 ?该 问题 以 如 下 方式 解决 。 除 了 SAD J}, IPsec 实体 也 维护 另 一 个 数据 结 
构 ， 它 称 为 安全 策略 库 (Security Policy Database，SPD)。 该 SPD 指示 哪些 类 型 的 数据 报 
(作为 源 IP Hoh. A AY IP 地址 和 协议 类 型 的 函数 ) 将 被 IPsec 处 理 ; 并 且 对 这 些 将 被 
IPsec 处 理 的 数据 报应 当 使 用 哪个 SA。 从 某 种 意义 上 讲 ， 在 SPD 中 的 信息 指示 对 于 一 个 到 
达 的 数据 报 做 “什么 ”; ESAD 中 的 信息 指示 “怎样 ”去 做 。 

IPsec 服务 的 小 结 


IPsec 究竟 提供 什么 样 的 服务 呢 ? 我 们 从 某 攻击 者 Trudy 的 角度 来 考察 这 些 服务 ， 
Trudy 是 一 个 中 间 人 ， 位 于 图 8-28 中 R1 和 R2 之 间 路 径 上 的 某 处 。 假 设 通 过 这 些 讨论 ， 
Trudy 不 知道 SA 所 使 用 的 鉴别 和 加 密 密 钥 。Trudy 能 够 做 些 什么 和 不 能 够 做 些 什么 呢 ? 第 
一 ，Trudy 不 能 看 到 初始 数据 报 。 如 果 事 实 如 此 ， 不 仅 Trudy 看 不 到 在 初始 数据 报 中 的 数 
据 ， 而 且 也 看 不 到 协议 号 、 源 IP 地 址 和 目的 IP 地 址 。 对 于 经 该 SA 发 送 的 数据 报 ，Trudy 
仅 知 道 该 数据 报 源 于 172. 16. 1. 0/24 的 某 台 主机 以 及 目的 地 为 172. 16. 2.0/24 的 某 台 主机 。 
她 不 知道 它 是 否 携带 TCP、UDP ak ICMP 数据 ;她 不 知道 它 是 否 携带 了 HTTP, SMTP 或 某 
些 其 他 类 型 的 应 用 程序 数据 。 因 此 这 种 机 密 性 比 SSL 范围 更 为 宽广 。 第 二 ，Trudy 试图 用 
反 转 数据 报 的 某 些 比特 来 自 改 在 SA 中 的 某 个 数据 报 ， 当 该 算 改 的 数据 报到 达 R2 时 ， 它 
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将 难以 通过 完整 性 核查 (使 用 MAC) ， 再 次 挫败 了 Trudy 的 恶意 尝试 。 第 三 ， 假 设 Trudy 
试图 假冒 RI1， 生 成 一 个 源 为 200. 168. 1. 100 和 目的 地 为 193. 68. 2. 23 的 IPsec 数据 报 。 
Trudy 的 攻击 将 是 无 效 的， 因为 这 个 数据 报 将 再 次 通 不 过 在 R2 的 完整 性 核查 。 最 后 ， 因 为 
IPsec 包含 序号 ，Trudy 将 不 能 够 生成 一 个 成 功 的 重 放 攻 击 。 总 而 言 之 ， 正 如 本 节 开 始 所 
言 ，IPsec 在 任何 通过 网 络 层 处 理 分 组 的 设备 对 之 间 ， 提 供 了 机 密 性 、 源 鉴别 、 数 据 完整 
性 和 重 放 攻击 防护 。 


8.7.5 IKE: IPsec 中 的 密 钥 管理 


当 某 VPN 具有 少量 的 端点 时 (例如 ， 图 8-28 中 只 有 两 台 路 由 器 ) ， 网 络 管理 员 能 够 
在 该 端点 的 SAD 中 人 工 键 入 SA 信息 (加密 /鉴别 算法 和 密 钥 及 SPI)。 这 样 的 “人 工 密 钥 
法 ”对 于 一 个 大 型 VPN 显然 是 不 切实 际 的 ， 因 为 大 型 VPN 可 能 由 成 百 甚至 上 千 台 IPsec 
路 由 器 和 主机 组 成 。 大 型 的 、 地 理 上 分 散 的 部 署 要 求 一 个 自动 的 机 制 来 生成 SA。IPsec 使 
用 因特网 密 钥 交换 (Internet Key Exchange, IKE) 协议 来 从 事 这 项 工作 ，IKE 由 RFC 5996 
定义 。 

IKE 与 SSL (参见 8.6 节 ) 中 的 握手 具有 某 些 类 似 。 每 个 Pse 实体 具有 一 个 证 书 ， 


该 证 书包 括 了 该 实体 的 公开 密 钥 。 如 同 使 用 SSL 一 样 ，IKE 协议 让 两 个 实体 交换 证 书 ,， 协 


商 鉴 别 和 加 密 算法 ， 并 安全 地 交换 用 于 在 IPsec SA 中 生成 会 话 密 钥 的 密 钥 材料 。 与 SSL 不 
同 的 是 ，IKE 应 用 两 个 阶段 来 执行 这 些 任务 。 
我 们 来 研究 图 8-28 中 两 台 路 由 器 RI 和 R 场景 下 的 这 两 个 阶段 。 第 一 个 阶段 由 Rl 和 
R2 之 间 报 文 对 的 两 次 交换 组 成 : 
© 在 报 文 的 第 一 次 交换 期 间 ， 两 侧 使 用 Diffie-Hellman (参见 课 后 习题 ) 在 路 由 器 之 
间 生 成 一 个 双向 的 IKE SA。 为 了 防止 混淆 ， 这 个 双向 IKE SA 完全 不 同 于 8. 6.3 
节 和 8. 6.4 节 所 讨论 的 IPsec SA。 该 IKE SA 在 这 两 台 路 由 器 之 间 提 供 了 一 个 鉴别 
的 和 加 密 的 信道 。 在 首 个 报 文 对 交换 期 间 ， 创 建 用 于 IKE SA 的 加 密 和 鉴别 的 密 
钥 。 还 创建 了 将 用 于 计算 后 期 在 阶段 2 使 用 的 IPsec SA 密 钥 的 一 个 主 密 钥 。 观 察 
在 第 一 步骤 期 间 ， 没 有 使 用 RSA 公 钥 和 私 钥 。 特 别 是 ，R1 或 R2 都 没有 通过 用 它 
们 的 私 钥 对 报 文 签字 而 泄露 其 身份 。 
© 在 报 文 的 第 二 次 交换 期 间 ， 两 侧 通 过 对 其 报 文 签名 而 透漏 了 它们 的 身份 。 然 而 ， 
这 些 身 份 并 未 透漏 给 被 动 的 嗅 探 者 ， 因 为 这 些 报 文 是 经 过 安全 的 IKE SA 信道 发 送 
的 。 同 时 在 这 个 阶段 期 间 ， 两 侧 协商 由 IPsec SA 应 用 的 IPsec 加 密 和 鉴别 算法 。 
在 IKE 的 第 二 个 阶段 ， 两 侧 生成 在 每 个 方向 的 一 个 SA。 在 阶段 2 结束 时 ， 对 这 两 个 
SA 的 每 一 侧 都 建立 了 加 密 和 鉴别 会 话 密 钥 。 然 后 这 两 侧 都 能 使 用 SA 来 发 送 安全 的 数据 
报 ， 如 同 8.7.3 节 和 8.7.4 节 描 述 的 那样 。 在 IKE 中 有 两 个 阶段 的 基本 动机 是 计算 成 本 ， 
即 因为 第 二 阶段 并 不 涉及 任何 公 钥 密码 ，IKE 能 够 以 相对 低 的 计算 成 本 在 两 个 IPsec 实体 
之 间 生 成 大 量 SA。 


8.8 使 无 线 LAN 安全 


在 无 线 网 络 中 安全 性 是 特别 重要 的 关注 因素 ， 因 为 这 时 携带 数据 帧 的 无 线 电 波 可 以 传 
播 到 远离 包含 无 线 基站 和 主机 的 建筑 物 以 外 的 地 方 。 在 本 节 中 ， 我们 简要 介绍 了 无 线 安全 
性 。 对 于 更 为 深入 地 探讨 ， 参 见 由 Edney 和 Arbaugh 撰写 的 可 读 性 很 强 的 书 Edney 
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在 802. 11 中 的 安全 性 问题 受到 了 技术 界 和 媒体 界 的 极 大 关注 。 在 进行 大 量 讨论 的 同 
时 ， 一 个 几乎 没有 争论 的 事实 是 ， 看 起 来 被 广泛 认同 的 初始 802. 11 规范 具有 一 些 严 重 的 
安全 性 缺陷 。 现 在 的 确 能 够 下 载 利用 这 些 漏 洞 的 公共 域 软件 ， 使 得 那些 使 用 该 普通 802. 11 
安全 性 机 制 的 用 户 面 对 安全 性 攻击 ， 就 像 根 本 没有 使 用 安全 性 措施 的 网 络 用 户 一 样 ， 门 户 
洞开 。 

在 下 面 一 节 中 ， 我 们 讨论 最 初 在 802. 11 规范 中 标准 化 的 安全 性 机 制 ， 该 规范 统称 为 
有 线 等 效 保密 (Wired Equivalent Privacy, WEP), BAX, WEP 意欲 提供 类 似 于 在 有 线 
网 络 中 的 安全 性 水 平 。 接 下 来 我 们 将 讨论 WEP 中 的 安全 性 漏洞 并 讨论 802. 11i 标准 ， 后 者 
是 在 2004 年 采纳 的 802. 11 的 本 质 上 更 为 安全 的 版 本 。 


8.8.1 ”有线 等 效 保密 


IEEE 802. 11 的 WEP 协议 设计 于 1999 年 ， 为 在 主机 和 无 线 接 人 点 ( 即 基站 ) 之 间 提 
供 鉴别 和 数据 的 加 密 。WEP 并 没有 指定 密 钥 管理 算法 ， 因 此 它 假定 主机 和 无 线 接 人 点 之 
间 通 过 带 外 方式 就 密 钥 达成 了 某 种 一 致 。 鉴 别 以 下 列 方 式 进行 : 

1) 无 线 主 机 通过 接 人 点 请 求 鉴别 。 

2) 接 人 点 以 一 个 128 字 节 的 不 重 数值 响应 该 鉴别 请 求 。 

3) 无 线 主 机 用 它 与 这 个 接 人 点 共享 的 密 钥 加 密 这 个 不 重 数值 。 

4) 接 入 点 解密 主机 加 密 的 不 重 数 值 。 

如 果 解 密 所 得 不 重 数值 与 初始 发 给 主机 的 值 相 同 ， 则 这 个 接 入 点 鉴别 了 该 主机 。 

图 8-30 阐述 了 WEP 数据 加 密 算法 。 假 定 主机 和 接 人 点 都 知道 一 个 秘密 的 40 比特 对 称 
密 钥 K;。 此 外 ， 一 个 24 比特 的 初始 向 量 CV) 附加 到 这 个 40 比特 的 密 钥 后 面 ， 产 生 用 
于 加 密 单个 帧 的 一 个 64 比特 密 钥 。 每 一 个 帧 所 使 用 的 IV 都 不 同 ， 所 以 每 一 帧 都 由 不 同 的 
64 比特 密 钥 加 密 。 加 密 以 如 下 方式 进行 。 首 先 为 每 个 数据 载荷 计算 一 个 4 字 节 的 CRC 值 
( 见 6.2 节 ) 。 然 后 用 RC4 流 密码 加 密 该 载荷 和 该 4 字 节 CRC。 我 们 这 里 不 涉及 RC4 的 细 
i (细节 参见 [Schneier 1995] 和 [Edney 2003 ] ) 。 就 我 们 的 目的 而 言 ， 知 道 下 列 事实 即 
可 : 对 于 密 钥 值 (此 时 为 64 比特 (Ks, IV) 密 钥 ) RC 算法 产生 一 个 密 钥 值 的 流 为 hi ， 
kN AN ,…， 这 些 密码 值 用 于 加 密 一 帧 中 的 数据 和 CRC 值 。 出 于 实用 的 目的 ， 我 们 可 以 认 
为 每 次 对 一 个 字 节 执行 这 些 操作 。 通 过 把 数据 的 第 i 字 节 d, 和 由 (Ks, IV) 对 生成 的 密 钥 
值 流 中 的 第 i 个 密 钥 如 执行 异 或 操作 进行 加 密 ， 以 产生 密 文 的 第 i 字 节 c: 

c, = d, Dk” 


密 钥 序列 产生 器 (对 给 定 的 Ks,，IV) 


IV (每 帧 ) 







Ks: 40 比 特 对 称 密 钥 





ky km * kia 
l l 1 1 
TATEN 

明文 帧 数据 加 CRC 一 d, d, d, 5 dy omg IE RC 
1 1 1 1 1 1 
tvy v v v v 

Cy C Cy = Cy Cys *** Onna 


图 8-30 802.11 WEP 协议 
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如 图 8-30 中 所 示 , 该 TV 值 逐 帧 而 变化 ， 以 明文 形式 出 现在 每 一 个 WEP 加 密 的 
802. 11 帧 的 首部 中 。 接 收 方 取 它 与 发 送 方 共享 的 秘密 40 比特 对 称 密 钥 ， 添 加 上 该 IV， 并 
使 用 形成 的 64 比特 的 密 钥 〈 它 与 发 送 方 执行 加 密 所 用 的 密 钥 相同 ) 来 解密 这 个 帧 。 

di =¢,@® ky 

正确 使 用 RC4 算法 要 求 同 一 个 64 比特 密 钥 决 不 能 使 用 超过 1 次 。 前 面 讲 过 WEP 密 钥 
是 每 一 帧 变换 一 次 。 对 于 某 给 定 的 K。( 即使 它 有 变化 ， 也 是 很 少 的 ) ， 这 意味 着 只 有 2” 
个 不 同 的 密 钥 可 用 。 如 果 随 机 选择 这 些 密 钥 的 话 ， 我 们 能 够 看 到 [Edney 2003 ] ， 则 仅 在 
处 理 12 000 帧 之 后 就 选中 相同 的 TV 值 (从 而 使 用 相同 的 64 比特 密 钥 ) 的 概率 超过 99% 。 
在 1KB 帧 长 和 11Mbps 数据 传输 率 的 情况 下 ， 传 输 12 000 帧 仅 需 几 秒 的 时 间 。 此 外 ， 由 于 
IV 值 在 该 帧 中 以 明文 形式 传输 ， 窃 听 者 就 会 发 现 何 时 使 用 了 一 个 重复 的 TV 值 。 

为 理解 重复 使 用 一 个 密 钥 可 能 出 现 的 几 个 问题 之 一 ， 考 虑 下 面 的 选择 明文 攻击 的 情 
况 ， 仍 以 Trudy 对 Alice 进行 攻击 为 例 。 假 定 Trudy (可 能 使 用 IP 哄骗) 向 Alice 发 出 一 个 
请 求 (例如 ,一 个 HTTP ak FTP 请 求 ) ， 要 求 Alice 传输 内 容 已 知 的 文件 di ,d, ,ds ,d,,…， 
Trduy 也 观察 到 Alice 发 送 的 已 加 密 数据 ol ,e ,cs,c4,…， 由 于 d; =ei 四 和 ， 如 果 在 这 个 等 
式 两 边 同 时 异 或 c;,， 可 得 到 : 

d; © Gi = ki 

根据 这 个 关系 ，Trudy 就 可 以 使 用 已 知 的 d; Alc, 值 计 算出 i。 下 一 次 Trudy 看 到 使 用 
同一 TV 值 时 ， 她 将 知道 密 钥 流 为 hi ka ,后 ,…， 并 可 使 用 这 些 密 钥 解 密 报 文 。 

对 于 WEP 还 有 其 他 几 个 值得 关注 的 安全 性 问题 。 [Fluhrer 2001] 描述 了 一 种 攻击 方 
法 ， 即 当选 择 某 些 弱 密 钥 时 在 RC4 中 暴露 出 的 一 种 已 知 弱点 。[ Stubblefield 2002] 讨论 了 
实现 和 开发 这 种 攻击 的 有 效 方法 。 对 WEP 的 另 一 种 关注 与 在 图 8-30 中 显示 并 在 802. 11 帧 
中 传输 的 用 以 检测 载荷 中 改变 的 比特 的 CRC 比特 有 关 。 然 而 ， 攻 击 者 在 改变 加 密 内 容 
(例如 用 乱七八糟 的 东西 替代 初始 的 加 密 数据 ) 后 ， 对 这 些 被 替换 的 东西 计算 出 一 个 
CRC， 并 将 该 CRC 放置 在 WEP 帧 中 产生 一 个 将 被 接收 方 接 受 的 802. 11 帧 。 此 时 所 需要 的 
是 诸如 我 们 在 8. 3 节 中 学 习 的 报 文 完整 性 技术 来 检测 内 容 自 改 或 替换 。 有 关 WEP 安全 性 
更 多 的 细节 ， 参见 [Edney 2003; Wright 2015] 及 其 中 的 参考 文献 。 


8.8.2 IEEE 802. 11i 


在 IEEE 802. 11 于 1999 年 发 布 后 不 久 ， 就 开始 研发 具有 更 强 安 全 性 机 制 的 802. 11 的 
新 型 、 改 进 版 本 。 这 个 新 标准 被 称 为 802. 11i， 于 2004 年 最 终 得 到 批准 。 如 我 们 将 看 到 的 
那样 ， 虽 然 WEP 提供 了 相对 弱 的 加 密 、 仅 有 单一 方式 执行 鉴别 并 且 没 有 密 钥 分 发 机 制 ， 
但 IEEE 802. 11i 却 提供 了 强 得 多 的 加 密 形 式 、 一 种 可 扩展 的 鉴别 机 制 集 合 以 及 一 种 密 钥 分 
发 机 制 。 下 面 我 们 概述 一 下 802. 11i; [TechOnline 2012] 是 一 篇 关于 802. 11i 的 优秀 ( 流 
式 音频 ) 技术 概述 。 

图 8-31 概述 了 802. 11i 的 框架 。 除 了 无 线 客户 和 接 入 点 外 ，802. 11i 定义 了 一 台 鉴 别 
服务 器 ，AP 能 够 与 它 通信 。 鉴 别 服务 器 与 AP 的 分 离 使 得 一 台 鉴 别 服务 器 服务 于 许多 AP， 
集中 在 一 台 服 务 器 中 作出 有 关 鉴 别 和 接 入 (通常 是 敏感 ) 的 决定 ， 降 低 了 AP 的 成 本 和 复 
杂 性 。802. 11i 运行 分 为 4 个 阶段 : 

1) 发 现 。 在 发 现 阶 段 ，AP 通告 它 的 存在 以 及 它 能 够 向 无 线 客户 节点 提供 的 鉴别 和 加 
密 形 式 。 客 户 则 请 求 它 希望 的 特定 鉴别 和 加 密 形式 。 尽 管 客户 和 AP 已 经 交换 了 报 文 ， 但 
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该 客户 还 没有 被 鉴别 ， 也 还 没有 加 密 密 钥 ， 因 此 在 该 客户 能 够 通过 无 线 信道 与 任何 远程 主 
机 通信 之 前 ， 还 需要 进行 几 个 其 他 步骤 。 






STA: 客户 站 点 
FS AP: 接 入 点 AS: a 
oS > p 
oO 
安全 能 力 的 发 现 
on, 
一 一 一 一 一 一 一 一 


Pe ee me 
STA 和 AS 相互 鉴别 ， 共 同 生 成 主 密 钥 (MK) 。AP 作 为 “通道 ” 


@ sTA 导 出 成 对 主 密 钥 (PMK) 
AS 导 出 相同 的 PMK 发 送 给 AP 


© STA、AP 使 用 PMK 导 出 用 于 报 文 
加 密 、 完 整 性 的 临时 密 钥 (TK) 
图 8-31 802. 11i; 运行 的 4 个 阶段 


2) 相互 鉴别 和 主 密 钥 (MK) 生成。 鉴别 发 生 在 无 线 客 户 和 鉴别 服务 器 之 间 。 在 这 个 
阶段 ， 接 入 点 基本 是 起 中 继 的 作用 ， 在 客户 和 鉴别 服务 器 之 间 转 发 报 文 。 可 扩展 鉴别 协议 
(Extensible Authentication Protocol, EAP) [ RFC 3748] 定义 了 客户 和 鉴别 服务 器 之 间 交 互 
时 简单 的 请 求 /响应 模式 中 使 用 的 端 到 端 报 STA: 客户 站 点 
文 格式 。 如 图 8-32 中 所 示 ，EAP 报 文 使 用 a ye 
EAPoL (EAP over LAN, [IEEE 802. 1x]) = 
进行 封装 ， 并 通过 802. 11 无 线 链 路 发 送 。 
这 些 EAP 报 文 在 接 入 点 拆 封 ， 然 后 再 使 用 
-RADIUS 协议 重新 封装 ， 经 UDP/IP 传输 到 
鉴别 服务 器 。 尽 管 RADIUS 服务 器 和 协议 
[RFC 2865] 并 不 为 802. 11i 所 要 求 ， 但 它 
们 是 802. 11i 的 事实 上 的 标准 组 件 。 最 近 标 


AS: 鉴别 服务 器 








图 8-32 EAP 是 一 个 端 到 端 协议 。EAP 报 文 使 用 


eh DIAMETER ID BE TRA EAPoL (运行 在 客户 和 接 入 点 之 间 的 无 线 
能 在 不 久 的 将 来 替代 RADIUS, 链 路 上 ) 封装 ， 并 使 用 RADIUS (运行 在 
使 用 EAP， 鉴 别 服务 器 能 够 选择 若干 接 人 点 和 鉴别 服务 器 之 间 的 UDP/IP 上 ) 


方式 中 的 一 种 来 执行 鉴别 。802. 11i 虽 未 强制 一 种 特殊 的 鉴别 方法 ， 但 经 常 使 用 EAP-TLS 
鉴别 方案 [RFC 5216], EAP-TLS 使 用 类 似 于 我 们 在 8. 3 节 中 研究 的 公 钥 技术 (包括 不 重 
数 加 密 和 报 文摘 要 ) ， 以 允许 客户 和 鉴别 服务 器 彼此 相互 鉴别 ， 并 导出 为 双方 所 知 的 一 个 
主 密 钥 。 

3) 成 对 主 密 钥 (Pairwise Master Key，PMK) 生成 。MK 是 一 个 仅 为 客户 和 鉴别 服务 
器 所 知 的 共享 密 钥 ， 它 们 都 使 用 MK 来 生成 一 个 次 密 钥 ， 即 成 对 主 密 钥 (PMK) 。 鉴 别 服 
务 器 则 向 AP 发 送 该 PMK。 这 正 是 我 们 所 希望 达到 的 目的 ! 客户 和 AP 现在 具有 一 个 共享 
的 密 钥 〈 前 面 讲 过 在 WEP 中 根本 不 涉及 密 钥 分 发 的 问题 )， 并 彼此 相互 鉴别 。 它 们 此 时 已 
经 快要 能 发 挥 效用 了 。 

4) 临时 密 钥 (Temporal Key, TK) 生成 。 使 用 PMK, 无线 客 户 和 AP 现在 能 够 生成 
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附加 的 、 将 用 于 通信 的 密 钥 。 其 中 的 关键 是 临时 密 铀 ，TK 将 被 用 于 执行 经 无 线 链 路 向 任 
意 远 程 主机 发 送 数据 的 链 路 级 的 加 密 。 

802. 11i 提供 了 几 种 加 密 形式 ， 其 中 包括 基于 AES 的 加 密 方案 和 WEP 加 密 的 强化 
版 本 。 


8.9 运行 安全 性 : 防火 墙 和 入 侵 检测 系统 


遍及 本 章 我 们 已 经 看 出 ， 因 特 网 不 是 一 个 很 安全 的 地 方 ， 即 有 坏 家 伙 出 没 ， 从 事 着 各 
种 各 样 的 破坏 活动 。 给 定 因特网 的 不 利 性 质 ， 我 们 现在 考虑 一 个 机 构 网 络 和 管理 它 的 网 络 
管理 员 。 从 网 络 管理 员 的 角度 看 ， 世 界 可 以 很 明显 地 分 为 两 个 阵营 ， 一 部 分 是 好 人 ， 他 们 
属于 本 机 构 网 络 ， 可 以 用 相对 不 受 限制 的 方式 访问 该 机 构 网 络 中 的 资源 ， 另 一 部 分 是 坏 家 
伙 ， 他 们 是 其 他 一 些 人 ， 访 问 网 络 资源 时 必须 经 过 仔细 审查 。 在 许多 机 构 中 ， 从 中 世纪 的 
城堡 到 现代 公司 的 建筑 物 ， 都 有 单一 的 出 口 / 人 口 ， 无 论 好 人 坏人 出 人 该 机 构 ， 都 需要 进 
行 安全 检查 。 在 一 个 城堡 中 ， 可 以 在 吊桥 的 一 端的 门口 执行 安全 检查 ;在 公司 大 厦 中 ,这 
些 工作 可 在 安全 台 完成 。 在 计算 机 网 络 中 ， 当 通信 流量 进入 /离开 网 络 时 要 执行 安全 检查 、 
做 记录 、 丢 弃 或 转发 ， 这 些 工作 都 由 被 称 为 防火 墙 、 人 侵 检测 系统 (IDS) 和 入侵 防止 系 
统 (IPS) 的 运行 设备 来 完成。 


8.9.1 防火 墙 


防火 墙 (firewall) 是 一 个 硬件 和 软件 的 结合 体 ， 它 将 一 个 机 构 的 内 部 网 络 与 整个 因 特 
网 隔离 开 ， 人 允许 一 些 数 据 分 组 通过 而 阻止 另 一 些 分 组 通过 。 防 火 墙 允许 网 络 管理 员 控 制 外 
部 和 被 管理 网 络 内 部 资源 之 间 的 访问 ， 这 种 控制 是 通过 管理 流入 和 流出 这 些 资源 的 流量 实 
现 的 。 防 火 墙 具有 3 个 目标 : 
© 从 外 部 到 内 部 和 从 内 部 到 外 部 的 
所 有 流量 都 通过 防火 墙 。 图 8-33 
显示 了 一 个 防火 墙 ， 位 于 被 管理 
网 络 和 因特网 其 余部 分 之 间 的 边 
界 处 。 虽 然 许多 大 型 机 构 可 使 用 
多 级 防火 墙 或 分 布 式 防火 墙 
[Skoudis 2006 ] ， 但 在 对 该 网 络 
的 单一 接 人 点 处 设置 一 个 防火 
墙 ， 如 图 8-33 中 所 示 ， 这 使 得 管 
理 和 施加 安全 访问 策略 更 为 
容易 。 
e 仅 被 授权 的 流量 (由 本 地 安全 
策略 定义 ) 允许 通过 。 随 着 进入 和 离开 机 构 网 络 的 所 有 流量 流 经 防火 墙 ， 该 防火 
墙 能 够 限制 对 授权 流量 的 访问 。 
© 防火 墙 自 身 免 于 渗透 。 防 火 墙 自 身 是 一 种 与 网 络 连接 的 设备 ， 如 果 设 计 或 安装 不 
当 ， 将 可 能 危及 安全 ,在 这 种 情况 下 它 仅 提供 了 一 种 安全 的 假象 (这 上 比 根本 没有 
防火 墙 更 糟糕 !) 。 
Cisco 和 Check Point 是 当今 两 个 领先 的 防火 墙 厂商 。 你 也 能 够 容易 地 从 Linux 套件 使 





图 8-33 在 被 管理 网 络 和 外 部 之 间 放 置 防火 墙 
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用 iptables (通常 与 Linus 装 在 一 起 的 公共 域 软件 ) 产生 一 个 防火 墙 (分 组 过 滤器 ) 。 此 
外 ， 如 第 4 章 和 第 5 章 中 所 讨论 的 ， 防 火 墙 现在 经 常 在 路 由 器 中 实现 并 使 用 SDN 进行 远程 
控制 。 

防火 墙 能 够 分 为 3 类 : 传统 分 组 过 滤器 (traditional packet filter) 、 状 态 过 滤器 
(stateful filter) 和 应 用 程序 网 关 (application gateway ) 。 在 下 面 小 节 中 ， 我 们 将 依次 学 习 
它们 。 

1. 传统 的 分 组 过 滤器 

如 图 8-33 所 示 ， 一 个 机 构 通常 都 有 一 个 将 其 内 部 网 络 与 其 ISP (并 因此 与 更 大 的 公共 
因特网 相连 ) 相连 的 网 关 路 由 器 。 所 有 离开 和 进入 内 部 网 络 的 流量 都 要 经 过 这 个 路 由 器 ， 
而 这 个 路 由 器 正 是 分 组 过 滤 (packet filtering) 出 现 的 地 方 。 分 组 过 滤器 独立 地 检查 每 个 数 
据 报 ,然后 基于 管理 员 特 定 的 规则 决定 该 数据 报应 当 允 许 通 过 还 是 应 当 丢 充 。 过 滤 决 定 通 
常 基于 下 列 因素 : 

。 IP 源 或 目的 地 址 。 
TE IP BEAR PH PMR Be: TCP, UDP, ICMP, OSPF 等 。 
TCP 或 UDP 的 源 和 目的 端口 。 
TCP 标志 比特 : SYN、ACK 等 。 
ICMP 报 文 类 型 。 
数据 报 离开 和 进入 网 络 的 不 同 规则 。 
对 不 同 路 由 器 接口 的 不 同 规则 。 

网 络 管理 员 基 于 机 构 的 策略 配置 防火 墙 。 该 策略 可 以 考虑 用 户 生 产 率 和 带宽 使 用 以 及 
对 一 个 机 构 的 安全 性 关注 。 表 8-5 列 出 了 一 个 机 构 可 能 具有 的 若干 可 能 的 策略 ， 以 及 它们 
是 如 何 用 一 个 分 组 过 滤器 来 处 理 分 组 的 。 例 如 ， 如 果 该 机 构 除 了 允许 访问 它 的 公共 Web 
服务 器 外 不 希望 任何 人 TCP 连接 的 话 ， 那 么 它 能 够 阻挡 所 有 的 人 TCP SYN 报 文 段 ， 但 具 
有 目的 地 端口 80 的 TCP SYN 报 文 段 除外 ， 并 且 该 目的 IP 地 址 对 应 于 该 Web 服务 器 。 如 
果 该 机 构 不 希望 它 的 用 户 用 因特网 无 线 电 应 用 独占 访问 带宽 ， 那么 它 能 够 阻挡 所 有 非 关键 
性 UDP 流量 (因为 因特网 无 线 电 经 常 是 通过 UDP 发 送 的 ) 。 如 果 该 机 构 不 希望 它 的 内 部 
网 络 被 外 部 绘制 结构 图 (被 跟踪 路 由 ) ， 那 么 它 能 够 阻挡 所 有 ICMP TTL 过 期 的 报 文 离开 
该 机 构 的 网 络 。 


表 8-5 对 于 Web 服务 器 在 130. 207. 244. 203 的 某 机 构 网 络 130. 207/16 ， 其 策略 和 对 应 的 过 滤 规 则 










策略 防火 墙 设置 
丢弃 所 有 到 任何 他 地址、 端口 80 的 出 分 组 


丢弃 所 有 到 除 130. 207. 244. 203 、 端 口 80 外 的 任何 IP 地 址 的 入 TCP 
SYN 分 组 


丢弃 所 有 入 UDP 分 组 , 但 DNS 分 组 除外 


丢弃 所 有 去 往 某 “ 广 播 ” 地 址 (例如 130.207.255.255) 的 ICMP 
ping 分 组 


丢弃 所 有 出 ICMP TTL 过 期 流量 











无 外 部 Web 访问 


KA TCP 连接 ， 但 那些 只 访问 机 构 公共 
Web 服务 器 的 分 组 除外 


防止 Web 无 线 电 占据 可 用 带宽 




















防止 你 的 网 络 被 用 于 一 个 smurf Dos 攻击 





防止 你 的 网 络 被 跟踪 路 由 


一 条 过 滤 策 略 能 够 基于 地 址 和 端口 号 的 结合 。 例 如 ， 一 台 过 滤 路 由 器 能 够 转发 所 有 
Telnet 数据 报 (那些 具有 端口 号 23 的 数据 报 ) ， 但 那些 包括 在 一 个 特定 的 IP 地 址 列表 中 的 
去 往 和 来 自 的 地 址 除外 。 这 些 策略 允许 在 许可 列表 上 的 地 址 进行 Telnet 连接 。 不幸 的 是 ， 
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基于 外 部 地 址 的 策略 无 法 对 其 源 地 址 被 哄骗 的 数据 报 提供 保护 。 

过 滤 也 可 根据 TCP ACK 比特 是 否 设置 来 进行 。 如 果 一 个 机 构 要 使 内 部 客户 连接 到 外 
部 服务 器 ， 却 要 防止 外 部 客户 连接 到 内 部 服务 器 ， 这 个 技巧 很 有 效 。3. 5 节 讲 过 ， 在 每 个 
TCP 连接 中 第 一 个 报 文 段 的 ACK 比特 都 设 为 0， 而 连接 中 的 所 有 其 他 报 文 段 的 ACK 比特 
都 设 为 1。 因此 ， 如 果 一 个 机 构 要 阻止 外 部 客户 发 起 到 内 部 服务 器 的 连接 ， 就 只 需 直 接 过 
滤 进 入 的 所 有 ACK 比特 设 为 0 的 报 文 段 。 这 个 策略 去 除了 所 有 从 外 部 发 起 的 所 有 TCP 连 
接 ， 但 是 允许 内 部 发 起 TCP 连接 。 

在 路 由 器 中 使 用 访问 控制 列表 实现 防火 墙 规则 ， 每 个 路 由 器 接口 有 它 自己 的 列表 。 
表 8-6 中 显示 了 对 于 某 机 构 222. 22/16 的 访问 控制 列表 的 例子 。 该 访问 控制 列表 适用 于 
将 路 由 器 与 机 构 外 部 ISP 连接 的 某 个 接口 。 这 些 规 则 被 应 用 到 通过 该 接口 自 上 而 下 传递 
的 每 个 数据 报 。 前 两 条 规则 一 起 允许 内 部 用 户 在 Web 上 冲浪 : 第 一 条 规则 允许 任何 有 具 
有 目的 端口 80 的 TCP 分 组 离开 该 机 构 网 络 ; 第 二 条 规则 人 允许 任何 具有 源 端 口 80 H. ACK 
比特 置 位 的 TCP 分 组 进入 该 机 构 网 络 。 注 意 到 如 果 一 个 外 部 源 试图 与 一 台 内 部 主机 建立 
一 条 TOP 连接 ， 该 连接 将 被 阻挡 ， 即 使 该 源 或 目的 端口 为 80。 接 下 来 的 两 条 规则 一 起 
允许 DNS 分 组 进入 和 离开 该 机 构 网 络 。 总 而 言 之 ， 这 种 限制 性 相当 强 的 访问 控制 列表 
阻挡 所 有 流量 ， 但 由 该 机 构 内 发 起 的 Web 流量 和 DNS 流量 除外 。[ CERT Filtering 2012 ] 
提供 了 一 个 推荐 的 端口 /协议 分 组 过 滤 的 列表 ， 以 避免 在 现 有 网 络 应 用 中 的 一 些 周 知 的 
安全 性 漏洞 。 


表 8-6 用 于 某 路 由 器 接口 的 访问 控制 列表 


目的 地 址 


222. 22/16 222. 22/16 的 外 部 
222. 22/16 的 外 部 | 222. 22/16 











222. 22/16 的 外 部 
222. 22/16 的 外 部 | 222. 22/16 
全 部 全 部 


2. 状态 分 组 过 滤器 

在 传统 的 分 组 过 滤器 中 ， 根 据 每 个 分 组 分 离 地 做 出 过 滤 决 定 。 状 态 过 滤器 实际 地 跟踪 
TCP 连接 ， 并 使 用 这 种 知识 作出 过 滤 决 定 。 

为 了 理解 状态 过 滤器 ， 我 们 来 重新 审视 表 8-6 中 的 访问 控制 列表 。 尽 管 限制 性 相当 
IR, K 8-6 中 的 访问 控制 列表 仍然 允许 来 自 外 部 的 ACK =1 且 源 端口 为 80 的 任何 分 组 到 
达 ， 通 过 该 过 滤器 。 这 样 的 分 组 能 够 被 试图 用 异常 分 组 来 崩溃 内 部 系统 、 执 行 拒绝 服务 攻 
击 或 绘制 内 部 网 络 的 攻击 者 使 用 。 幼 稚 的 解决 方案 是 也 阻挡 TCP ACK 分 组 , 但 是 这 样 的 
方法 将 妨碍 机 构 内 部 的 用 户 在 Web 上 冲浪 。 

状态 过 滤器 通过 用 一 张 连接 表 来 跟踪 所 有 进行 中 的 TCP 连接 来 解决 这 个 问题 。 这 种 
方法 是 可 能 的 : 因为 防火 墙 能 够 通过 观察 三 次 握手 (SYN, SYNACK 和 ACK) 来 观察 一 
条 新 连接 的 开始 ; 而 且 当 它 看 到 该 连接 的 一 个 FIN 分 组 时 ， 它 能 够 观察 该 连接 的 结束 。 
当 防 火 墙 经 过 比如 说 60 秒 还 没有 看 到 该 连接 的 任何 活动 性 ， 它 也 能 够 (保守 地 ) 假设 
该 连接 结束 了 。 某 防火 墙 的 一 张 连接 表 例 子 显示 在 表 8-7 中 。 这 张 连接 表 指 示 了 当前 有 
3 条 进行 中 的 TCP 连接 ， 所 有 的 连接 都 是 从 该 机 构 内 部 发 起 的 。 此 外 ， 该 状态 过 滤器 在 
它 的 访问 控制 列表 中 包括 了 一 个 新 栏 ， 即 “核对 连接 ”， 如 表 8-8 中 所 示 。 注 意 到 表 8-8 
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与 表 8-6 中 的 访问 控制 列表 相同 ， 只 是 此 时 它 指示 应 当 核对 其 中 两 条 规则 所 对 应 的 
连接 。 


表 8-7 用 于 状态 过 滤器 的 连接 表 











源 地 址 目的 地 址 
222. 22.1.7 37. 96. 87. 123 
222. 22. 93, 2 








199. 1. 205. 23 








222. 22. 65. 143 203. 77. 240. 43 





表 8-8 用 于 状态 过 滤器 的 访问 控制 列表 






































动作 源 地 址 目的 地 址 协议 源 端 口 目的 端口 标志 比特 | 核对 连接 
允许 | 222. 22/16 222. 22/16. 的 外 部 TCP >1023 80 任意 
Pe rt -一 F 

许 | 222. 22/16 的 外 部 | 222. 22/16 TCP 80 > 1023 ACK X 
允许 | 222.22716 222. 22/16 的 外 部 | UDP > 1023 53 一 
允许 | 222. 22/16 的 外 部 | 222. 22/16 UDP 人 > 1023 一 X 
拒绝 | 全 部 全 部 全 部 全 部 全 部 全 部 




















我 们 浏览 某 些 例 子 来 看 看 连接 表 和 扩展 的 访问 控制 列表 是 如 何 联手 工作 的 。 假 设 一 个 
攻击 者 通过 发 送 一 个 具有 TCP 源 端口 80 和 ACK 标志 置 位 的 数据 报 ， 试 图 向 机 构 网 络 中 发 
送 一 个 异常 分 组 。 进 一 步 假设 该 分 组 具有 源 端口 号 12543 和 源 IP 地 址 150. 23. 23.155, 4 
这 个 分 组 到 防火 墙 时 ， 防 火 墙 核对 表 8-8 中 的 访问 控制 列表 ， 该 表 指 出 在 允许 该 分 组 进入 
机 构 网 络 之 前 还 必须 核对 连接 表 。 该 防火 墙 正确 地 核对 了 连接 表 ， 发 现 这 个 分 组 不 是 某 进 
行 中 的 TCP 连接 的 一 部 分 ， 从 而 拒绝 了 该 分 组 。 举 第 二 个 例子 ， 假 设 一 个 内 部 的 用 户 要 在 
外 部 Web 站 点 冲浪 。 因 为 该 用 户 首先 发 送 了 一 个 TCP SYN 报 文 段 ， 所 以 该 用 户 的 TCP E 
接 在 连接 表 中 有 了 记录 。 当 Web 服务 器 发 送 回 分 组 ( ACK 比特 进行 了 必要 的 设置 ) ， 该 防 
火 墙 核 对 了 连接 表 并 明白 一 条 对 应 的 连接 在 进行 中 。 防 火 墙 因此 将 让 这 些 分 组 通过 ， 从 而 
不 会 干扰 内 部 用 户 的 Web 冲浪 活动 。 

3. 应 用 程序 网 关 

在 上 面 的 例子 中 ， 我 们 已 经 看 到 了 分 组 级 过 滤 使 得 一 个 机 构 可 以 根据 IP 的 内 容 和 
TCP/UDP 首部 (包括 四 地 址 、 端 口号 和 ACK 比特 ) 执行 粗 粒度 过 滤 。 但 是 如 果 一 个 机 构 
仅 为 一 个 内 部 用 户 的 受 限 集 合 (与 卫 地 址 情况 正 相 反 ) 提供 Telnet 服务 该 怎样 做 呢 ? 如 
果 该 机 构 要 这 些 特 权 用 户 在 允许 创建 向 外 部 的 Telnet 会 话 之 前 首先 鉴别 他 们 自己 该 怎样 做 
呢 ? 这 些 任 务 都 超出 了 传统 过 滤器 和 状态 过 滤器 的 能 力 。 的 确 ， 有 关内 部 用 户 的 身份 信息 
是 应 用 层 数 据 ， 并 不 包括 在 IP/TCP/UDP 首部 中 。 

为 了 得 到 更 高 水 平 的 安全 性 ， 防 火 墙 必须 把 分 组 过 滤器 和 应 用 程序 网 关 结 合 起 来 。 应 
用 程序 网 关 除 了 看 IP/TCP/UDP 首部 外 ， 还 基于 应 用 数据 来 做 策略 决定 。 一 个 应 用 程序 网 
关 (application gateway) 是 一 个 应 用 程序 特定 的 服务 器 ， 所 有 应 用 程序 数据 (人 和 出 的 ) 
都 必须 通过 它 。 多 个 应 用 程序 网 关 可 以 在 同一 主机 上 和 运行， 但 是 每 一 个 网 关 都 是 有 自己 的 
进程 的 单独 服务 器 。 

为 了 更 深入 地 了 解 应 用 程序 网 关 ， 我 们 来 设计 一 个 防火 墙 ， 它 只 允许 内 部 客户 的 受 限 
集合 向 外 Telnet， 不 允许 任何 外 部 客户 向 内 Telnet。 这 一 策略 可 通过 将 分 组 过 滤 (在 一 台 
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路 由 器 上 ) 和 一 个 Telnet 应 用 程序 网 关 结合 起 来 实现 ， 如 图 8-34 所 示 。 路 由 器 的 过 滤器 


配置 为 阻塞 所 有 Telnet 连接 ， 但 从 该 应 主机 到 网 关 的 网 关 的 到 远程 主机 





用 程序 网 关 P 地 址 发 起 的 连接 除外 。 人 人 的 Telnet 会 话 
这 样 的 过 滤器 配置 迫使 所 有 向 外 的 MM a 
Telnet 连 接 都 通过 应 用 程序 网 关 。 现 在 
考虑 一 个 要 向 外 部 Tenet RRAS M aE E 

这 个 用 户 必须 首先 和 应 用 程序 网 关 建立 “ 和 
一 个 Telnet 会 话 。 在 网 关 《网 关 监 听 进 E70 ea 

入 的 Telnet 会 话 ) 上 一 直 运行 的 应 用 程 
序 提示 用 户 输 入 用 户 ID 和 口令 。 当 这 
个 用 户 提供 这 些 信息 时 ， 应 用 程序 网 关 
检查 这 个 用 户 是 否 得 到 许可 向 外 Tel- 
neto- 如 果 没 有 ， 网 关 则 中 止 这 个 内 部 
用 户 向 该 网 关 发 起 的 Telnet 连接 。 如 果 
该 用 户 得 到 许可 ， 则 这 个 网 关 : DER 
用 户 输入 它 所 要 连接 的 外 部 主机 的 主机 图 8-34 由 应 用 程序 网 关 和 过 滤器 组 成 的 防火 墙 
名 ; @ 在 这 个 网 关 和 某 外 部 主机 之 间 奸 

立 一 个 Telnet 会 话 ，@ 将 从 这 个 用 户 到 达 的 所 有 数据 中 继 到 该 外 部 主机 ， 并 且 把 来 自 这 个 外 
部 主机 的 所 有 数据 都 中 继 给 这 个 用 户 。 所 以 ， 该 Telnet 应 用 程序 网 关 不 仅 执行 用 户 授权 ， 而 
且 同时 充当 一 个 Telnet 服务 器 和 一 个 Telnet 客户 ， 在 这 个 用 户 和 该 远程 Telnet 服务 器 之 间 中 
继 信息 。 注 意 到 过 滤器 因为 该 网 关 发 起 向 外 部 的 Telnet 连接 ， 将 允许 执行 步骤 @。 


匿名 与 隐私 | 
假定 你 要 访问 一 个 有 争议 的 Web 网 站 (例如 某 政治 活动 家 的 网 站 ) ， 并 且 你 : OA 
想 向 该 Web 网 站 透漏 你 的 IP 地 址 ; @ 不 想 要 你 的 本 地 ISP ( 它 可 能 是 你 住家 或 办 公 室 
的 ISP) 知道 你 正在 访问 该 站 点 ; @ 不 想 要 你 的 本 地 ISP 看 到 你 正在 与 该 站 点 交换 的 数 | 
据 。 如 果 你 使 用 传统 的 方法 直接 与 该 Web 站 点 连接 而 没有 任何 加 密 ， 你 无 法 实现 这 三 | 
个 诉求 。 即 使 你 使 用 SSL， 你 也 无 法 实现 前 两 个 诉求 : 你 的 源 IP 地 址 呈现 在 你 发 送 给 | 
Web 网 站 的 每 个 数据 报 中 ; 你 发 送 的 每 个 分 组 的 目的 地 址 能 够 容易 地 被 你 本 地 JISP 嗅 
探 到 。 
为 了 获得 隐私 和 匿名 ， 你 能 够 使 用 如 图 8-35 所 示 的 一 种 可 和信 代理 服务 器 和 SSL 的 
组 合 。 利 用 这 种 方法 ， 你 首先 与 可 信 代 理 建 立 一 条 SSL 连接 。 然 后 你 在 该 SSL 连接 中 向 
所 希望 站 点 的 网 页 发 送 一 个 HTTP 请 求 。 当 代理 接收 到 该 SSL 加 密 的 HTTP 请 求 ， 它 解 
密 请 求 并 向 Web 站 点 转发 该 明文 HTTP 请 求 。 接 下 来 Web 站 点 响应 该 代理 ， 该 代理 经 
过 SSL 再 向 你 转发 该 响应 。 因 为 该 Web 站 点 仅 看 到 代理 的 卫 地 址 ， 并 非 你 的 客户 IP 地 
址 ， 你 的 确 获 得 了 对 该 Web 站 点 的 匿名 访问 。 并 且 因 为 你 和 代理 之 间 的 所 有 流量 均 被 
加 密 ， 你 的 本 地 ISP 无 法 通过 对 你 访问 的 站 点 做 日 志和 记录 你 交换 的 数据 来 侵犯 你 的 隐 
私 。 今 天 许多 公司 (例如 proxify. com) 提供 了 这 种 代理 服务 。 


Ls a a 
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图 8-35 利用 代理 提供 匿名 和 隐私 


当然 ， 在 这 个 解决 方案 中 ， 你 的 代理 知道 一 切 : 它 知 道 你 的 IP 地 址 和 你 正在 冲浪 
的 站 点 的 卫 地 址 ; 并 且 它 能 够 看 到 你 与 该 Web 站 点 之 间 以 明文 形式 交换 的 所 有 流量 。 
因此 ， 这 种 解决 方案 的 好 坏 取 决 于 该 代理 的 可 信 度 。 由 TOR 匿名 和 隐私 服务 所 采用 的 
一 种 更 为 健壮 的 方法 是 ， 让 你 的 流量 路 由 通过 一 系列 “不 串通 ”的 代理 服务 器 [TOR 
2012], 。 特 别 是 ，TOR 允许 独立 的 个 体 向 其 代理 池 贡 献 代理 。 当 菜 用 户 使 用 TOR 与 一 个 
服务 器 连接 ，TOR 随机 地 (从 它 的 代理 池 ) 选择 一 条 三 个 代理 构成 的 链 ， 并 通过 该 链 
在 客户 和 服务 器 之 间 路 由 所 有 流量 。 以 这 种 方式 ， 假 设 这 些 代 理 并 不 串通 ， 无 人 知道 在 
你 的 他 地址 和 目标 Web 站 点 之 间 发 生 的 通信 。 此 外 ， 尽管 在 最 后 的 代理 和 服务 器 之 间 
发 送 明 文 ， 但 这 个 最 后 代理 并 不 知道 哪个 P 地 址 正在 发 送 和 接收 明文 。 





内 部 网 络 通常 有 多 个 应 用 程序 网 关 ， 例 如 Telnet, HTTP, FTP 和 电子 邮件 网 关 。 事 实 
E, 一 个 机 构 的 邮件 服务 器 ( 见 2.3 节 ) Al Web 高 速 缓存 都 是 应 用 程序 网 关 。 

应 用 程序 网 关 也 有 其 缺陷 。 首 先 ， 每 一 个 应 用 程序 都 需要 一 个 不 同 的 应 用 程序 网 关 。 
第 二 ， 因 为 所 有 数据 都 由 网 关 转发 ， 付 出 的 性 能 负担 较 重 。 当 多 个 用 户 或 应 用 程序 使 用 同 
一 个 网 关 计算 机 时 ， 这 成 为 特别 值得 关注 的 问题 。 最 后 ， 当 用 户 发 起 一 个 请 求 时 ， 客 户 软 
件 必须 知道 如 何 联系 这 个 网 关 ， 并 且 必 须 告 诉 应 用 程序 网 关 如 何 连接 到 哪个 外 部 服务 器 。 


8.9.2 入 侵 检 测 系统 


我 们 刚刚 看 到 ， 当 决定 让 哪个 分 组 通过 防火 墙 时 ， 分 组 过 滤器 〈 传 统 的 和 状态 的 ) 检 
# IP. TCP, UDP 和 ICMP 首部 字段 。 然 而 ， 为 了 检测 多 种 攻击 类 型 ， 我 们 需要 执行 深度 
分 组 检查 (deep packet inspection) ， 即 查看 首部 字段 以 外 部 分 ， 深 入 查看 分 组 携带 的 实际 
应 用 数据 。 如 我 们 在 8. 9. 1 节 所 见 ， 应 用 程序 网 关 经 常 做 深度 分 组 检查 。 而 一 个 应 用 程序 
网 关 仅 对 一 种 特定 的 应 用 程序 执行 这 种 检查 。 

显然 ， 这 为 另 一 种 设备 提供 了 商机 ， 即 一 种 不 仅 能 够 检查 所 有 通过 它 传递 的 分 组 的 首部 
(类 似 于 分 组 过 滤器 ) ， 而 且 能 执行 深度 分 组 检查 〈 与 分 组 过 滤器 不 同 ) 的 设备 。 当 这 样 的 
设备 观察 到 一 个 可 疑 的 分 组 时 ， 或 一 系列 可 疑 的 分 组 时 ， 它 能 够 防止 这 些 分 组 进入 该 机 构 网 
络 。 或 者 仅仅 是 因为 觉得 该 活动 可 疑 ， 该 设备 虽说 能 够 让 这 些 分 组 通过 ,但 要 向 网 络 管理 员 
发 出 告警 ， 网 络 管理 员 然 后 密切 关注 该 流量 并 采取 适当 的 行动 。 当 观察 到 潜在 恶意 流量 时 能 
产生 告警 的 设备 称 为 入 侵 检测 系统 (Intrusion Detection System，IDS) 。 滤 除 可 疑 流量 的 设备 
称 为 入 侵 防止 系统 (Intrusion Prevention System，IPS) 。 在 本 节 中 我 们 一 起 学 习 IDS 和 IPS 这 


430 EE 





两 种 系统 ， 因 为 这 些 系统 的 最 为 有 趣 的 技术 方面 是 它们 检测 可 疑 流量 的 原理 (而 不 是 它们 是 
否 发 送 告警 或 丢弃 分 组 ) 。 我 们 因此 将 IDS 系统 和 IPS 系统 统称 为 IDS 系统 。 

IDS 能 够 用 于 检测 多 种 攻击 ， 包 插 网 络 映射 (例如 使 用 nmap 进行 分 析 ) 、 端 口 扫 描 、 
TCP RRHH, DoS 带宽 洪 泛 攻 击 、 蜂 虫 和 病毒 、 操 作 系 统 脆 弱 性 攻击 和 应 用 程序 脆弱 性 攻 
击 。( 参 见 1.6 节 有 关 网 络 攻击 的 概述 内 容 。) 目前 ， 数 以 千 计 的 机 构 应 用 了 IDS 系统 。 这 
些 已 部 署 的 系统 有 许多 是 专用 的 ，Ciseo 、Check Point 和 其 他 安全 装备 厂商 在 市 场 上 销售 这 
些 系统 。 但 是 许多 已 部 署 的 IDS 系统 是 公共 域 系 统 ， 如 极为 流行 的 Snort IDS 系统 (我们 
将 简要 讨论 它 ) 。 

一 个 机 构 可 能 在 它 的 机 构 网 络 中 部 署 一 个 或 多 个 IDS 传感器 。 图 8-36 显示 了 一 个 具 
有 3 个 IDS 传感器 的 机 构 。 当 部 署 了 多 个 传感器 时 ， 它 们 通常 共同 工作 ， 向 一 个 中 心 IDS 
处 理 器 发 送 有 关 可 疑 流量 活动 的 信息 ， 中 心 处 理 器 收集 并 综合 这 些 信息 ， 当 认为 适合 时 向 
网 络 管理 员 发 送 告警 。 在 图 8-36 中 ， 该 机 构 将 其 网 络 划 分 为 两 个 区 域 : 一 个 高 度 安 全 区 
域 ， 由 分 组 过 滤器 和 应 用 程序 网 关 保 护 ， 并 且 由 IDS 系统 监视 ;一 个 较 低 度 安 全 区 域 (FR 
之 为 非 军 事 区 (DeMilitarized Zone，DMZ ) ) ， 该 区 域 仅 由 分 组 过 滤器 保护 ， 但 也 由 IDS 系 
统 监视 。 注 意 到 DMZ 包括 了 该 机 构 需 要 与 外 部 通信 的 服务 器 ， 如 它 的 公共 Web 服务 器 和 
它 的 权威 DNS 服务 器 。 





图 例 : 


G =IDs 传 感 器 


图 8-36 ”部 署 一 个 过 滤器 、 一 个 应 用 程序 网 关 和 多 个 IDS 传感器 的 机 构 


此 时 你 也 许 想 知道 ， 为 什么 使 用 多 个 IDS 传感器 ? 为 什么 在 图 8-36 中 不 只 是 在 分 组 
过 滤器 后 面 放置 一 个 IDS 传感器 〈 或 者 甚至 与 分 组 过 滤器 综合 )? 我 们 将 很 快 看 到 ，IDS 
不 仅 需要 做 深度 分 组 检查 ， 而 且 必 须要 将 每 个 过 往 的 分 组 与 数 以 万 计 的 “特征 (signa- 
ture) ”进行 比较 ; 这 可 能 导致 极 大 的 处 理 量 ， 特 别 是 如 果 机 构 从 因特网 接收 每 秒 数 十 亿 
比特 的 流量 时 更 是 如 此 。 将 IDS 传感器 进一步 向 下 游 放置 ， 每 个 传感器 仅 看 到 该 机 构 流 量 
的 一 部 分 ， 维 护 能 够 更 容易 。 无 论 如 何 ， 目 前 有 许多 高 性 能 IDS 和 IPS 系统 可 供 使 用 ， 许 
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多 机 构 实 际 上 能 够 在 靠近 其 接 入 路 由 器 附近 只 使 用 一 个 传感器 。 

IDS 系统 大 致 可 分 类 为 基于 特征 的 系统 (signature-based system) 或 基于 异常 的 系统 
(anomaly-based system) 。 基 于 特征 的 IDS 维护 了 一 个 范围 广泛 的 攻击 特征 数据 库 。 每 个 特 
征 是 与 一 个 人 侵 活动 相关 联 的 规则 集 。 一 个 特征 可 能 只 是 有 关 单 个 分 组 的 特性 列表 (例如 
源 和 目的 端口 号 、 协 议 类 型 和 在 分 组 载荷 中 的 特定 比特 串 )， 或 者 可 能 与 一 系列 分 组 有 关 。 
这 些 特征 通常 由 研究 了 已 知 攻 击 、 技 艺 熟练 的 网 络 安全 工程 师 生成 。 一 个 机 构 的 网 络 管理 
员 能 够 定制 这 些 特征 或 者 将 其 加 进 数 据 库 中 。 

从 运行 上 讲 ， 基 于 特征 的 IDS 嗅 探 每 个 通过 它 的 分 组 ， 将 每 个 嗅 探 的 分 组 与 数据 库 中 
的 特征 进行 比较 。 如 果 某 分 组 〈 或 分 组 序列 ) 与 数据 库 中 的 一 个 特征 相 匹配 ，IDS 产生 一 
个 告警 。 该 告警 能 够 发 送 一 个 电子 邮件 报 文 给 网 络 管理 员 ， 能 够 发 送 给 网 络 管理 系统 ， 或 
只 是 做 日 志 以 供 以 后 检查 。 

尽管 基于 特征 的 IDS 系统 部 署 广泛 ， 但 仍 具 有 一 些 限制 。 更 重要 的 是 ， 它 们 要 求 根 据 
以 前 的 攻击 知识 来 产生 一 个 准确 的 特征 。 换 言 之 ， 基 于 特征 的 IDS 对 不 得 不 记录 的 新 攻击 
完全 缺乏 判断 力 。 另 一 个 缺点 是 ， 即 使 与 一 个 特征 匹配 7 它 也 可 能 不 是 一 个 攻击 的 结果 ， 
因此 产生 了 一 个 虚假 告警 。 最 后 ， 因 为 每 个 分 组 必须 与 范围 广泛 的 特征 集合 相 比较 ，IDS 
可 能 处 于 处 理 过 载 状态 并 因此 难以 检测 出 许多 恶意 分 组 。 

当 基 于 异常 的 IDS 观察 正常 运行 的 流量 时 ， 它 会 生成 一 个 流量 概况 文件 。 然 后 ， 它 寻 
找 统计 上 不 寻常 的 分 组 流 ， 例 如 ，ICMP 分 组 不 寻常 的 百分比 ， 或 端口 扫描 和 ping 掠 过 导 
致 指数 性 突然 增长 。 基 于 异常 的 IDS 系统 最 大 的 特点 是 它们 不 依赖 现 有 攻击 的 以 前 知识 。 
在 另 一 方面 ， 区 分 正常 流量 和 统计 异常 流量 是 一 个 极 具 挑 战 性 的 问题 。 迄 今 为 止 ， 大 多 数 
部 署 的 IDS 主要 是 基于 特征 的 ， 尽 管 某 些 IDS 包括 了 某 些 基 于 异常 的 特性 。 

Snort 


Snort 是 一 种 公共 域 开 放 源 码 的 IDS， 现 有 部 署 达 几 十 万 [Snort 2012; Koziol 2003 ] 。 
- 它 能 够 运行 在 Linux, UNIX 和 Windows 平台 上 。 它 使 用 了 通用 的 嗅 探 接口 libpcap Wire- 
shark 和 许多 其 他 分 组 嗅 探 器 也 使 用 了 libpcap。 它 能 够 轻松 地 处 理 100Mbps 的 流量 ; 安装 
在 千 兆 比特 / 秒 流 量 速率 下 工作 ， 需 要 多 个 Snort 传感器 。 
为 了 对 Snort 有 一 些 认 识 ， 我 们 来 看 一 个 Snort 特征 的 例子 : 


alert icmp SEXTERNAL_NET any -> SHOME_NET any 
(msg:”ICMP PING NMAP”; dsize: 0; itype: 8;) 


这 个 特征 由 从 外 部 ( $EXTERNAL_NET) 进入 机 构 网 络 ( $HOME_NET) 的 任何 IC- 
MP 分 组 所 匹配 ， 其 类 型 是 8 (ICMP ping) 并 且 具 有 空 负载 (dsize =0)。 因 为 nmap ( 参 
见 1.6 节 ) 用 这 些 特定 的 特征 产生 这 些 ping 分 组 ， 所 以 设计 出 该 特征 来 检测 nmap 的 ping 
扫描 。 当 某 分 组 匹配 该 特征 时 ，Snort 产生 一 个 包括 “ICMP PING NAMP” 报 文 的 告警 。 

也 许 关 于 Snort 印象 最 为 深刻 的 是 巨大 的 用 户 社区 和 维护 其 特征 数据 库 的 安全 专家 。 通 
常 在 一 个 新 攻击 出 现 后 的 几 个 小 时 内 ，Snort 社区 就 编写 并 发 布 一 个 攻击 特征 ， 然 后 它 就 能 被 
分 布 在 全 世界 的 数 十 万 Snort 部 署 者 下 载 。 此 外 ， 使 用 Snort 特征 的 语法 ， 网 络 管理 员 能 够 根 
据 他 们 自己 的 机 构 需 求 ， 通 过 修改 现 有 的 特征 或 通过 创建 全 新 的 特征 来 裁剪 某 个 特征 。 


8.10 ”小结 


在 本 章 中 ， 我 们 考察 了 秘密 情人 Bob 和 Alice 能 够 用 于 安全 通信 的 各 种 机 制 。 我 们 看 
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到 Bob 和 Alice 对 下 列 因 素 感 兴趣 : 机 密 性 (因此 只 有 他 们 才能 理解 传输 的 报 文 内 容 ) 、 端 
点 鉴别 (因此 他 们 确信 正在 与 对 方 交 谈 ) 和 报 文 完整 性 (因此 他 们 确信 在 传输 过 程 中 他 
们 的 报 文 未 被 算 改 )。 当 然 ， 安 全 通信 的 需求 并 不 限于 秘密 情人 人。 的确, 我们 在 8. 5 ~ 8.8 
节 中 看 到 ， 可 以 在 网 络 体 系 结构 中 的 各 个 层次 使 用 安全 性 ， 使 之 免 受 采用 各 种 各 样 攻击 手 
段 的 坏 家 伙 们 的 侵扰 。 

本 章 前 面部 分 给 出 了 安全 通信 所 依赖 的 各 种 原理 。 在 8. 2 节 中 ， 我 们 涉及 了 加 密 和 解 
密 数据 的 密码 技术 ,包括 对 称 密 钥 密码 和 公开 密 钥 密码 。 作 为 今天 网 络 中 两 种 重要 的 密码 
技术 的 特定 的 学 习 案 例 ， 我 们 考察 了 DES Fl RSA, 

在 8.3 节 中 ,我们 研究 了 提供 报 文 完整 性 的 两 种 方法 : 报 文 鉴别 码 (MAC) 和 数字 签 
名 。 这 两 种 方法 有 一 些 共同 之 处 。 它 们 都 使 用 了 密码 散 列 函数 ， 这 两 种 技术 都 使 我 们 能 够 
验证 报 文 的 源 以 及 报 文 自身 的 完整 性 。 一 个 重要 的 差异 是 MAC 不 依赖 于 加 密 ， 而 数字 签 
名 要 求 公 钥 基 础 设施 。 如 我 们 在 8. 5 ~ 8. 8 节 所 见 ， 这 两 种 技术 广泛 在 实际 中 都 得 到 了 广 
泛 应 用 。 此 外 ， 数 字 签 名 用 于 生成 数字 证 书 ， 数 字 证 书 对 于 证 实 公 钥 的 合法 性 是 重要 的 。 
在 8.4 节 中 ,我 们 考察 了 端点 鉴别 并 引入 了 不 重 数 以 防御 重 放 攻击 。 

在 8.5 ~8.8 节 中 ,我 们 研究 了 几 种 在 实践 中 得 到 广泛 使 用 的 安全 性 网 络 协议 。 我 们 
看 到 了 对 称 密 钥 密码 在 PEP、SSL、IPsec 和 无 线 安全 性 中 的 核心 地 位 。 我 们 看 到 了 公开 密 - 
钥 密 码 对 PGP 和 SSL 是 至 关 重 要 的 。 我 们 看 到 PCP 使 用 数字 签名 而 SSL 和 IPsec 使 用 MAC 
来 保证 报 文 完整 性 。 在 目前 理解 了 密码 学 的 基本 原理 以 及 学 习 了 这 些 原理 的 实际 应 用 方法 
之 后 ， 你 现在 已 经 有 能 力 设 计 你 自己 的 安全 网 络 协议 了 ! 

利用 8.2 ~8.4 节 所 包含 的 技术 ，Bob 和 Alice 就 能 够 安全 通信 了 。 ( 只 希望 他 们 是 学 
习 了 这 些 材料 的 网 络 专业 学 生 ， 因 此 能 够 使 他 们 的 约会 不 会 被 Trudy 发 现 !) 而 机 密 性 仅 
是 整个 网 络 安全 的 一 小 部 分 。 如 我 们 在 8. 9 节 中 所 学 习 ， 现 在 网 络 安全 的 焦点 越 来 越 多 地 
关注 网 络 基 础 设施 的 安全 性 ， 以 防止 “ 坏 家 伙 ” 的 潜在 猛烈 攻击 。 在 本 章 的 后 面部 分 ， 我 
们 因此 学 习 了 防火 墙 和 IDS 系统 ， 它 们 检查 进入 和 离开 一 个 机 构 网 络 的 分 组 。 

本 章 已 经 涉及 了 许多 基础 性 问题 ， 同 时 关注 了 现代 网 络 安全 性 中 最 为 重要 的 主题 。 希 
望 深入 钻研 的 读者 最 好 研究 本 章 中 引用 的 文献 。 特 别 是 ， 我们 推荐 以 下 读物 ， 关于 攻击 和 
运行 安全 性 的 【Skoudis 2006 ] ， 关 于 密码 学 及 其 如 何 应 用 于 网 络 安 全 的 [ Kaufman 1995], 
有 深度 且 可 读 性 强 的 关于 SSL 处 理 的 【Rescorla 2001 ] ， 以 及 透彻 地 讨论 802. 11 安全 性 且 
包括 对 WEP 及 其 缺陷 的 深入 研究 的 [Edney 2003 ] 。 


课 后 习题 和 问题 


复习 题 


8.15 

RI. 报 文 机 密 性 和 报 文 完 整 性 之 间 的 区 别 是 什么 ? 你 能 具有 机 密 性 而 没有 完整 性 吗 ? 你 能 具有 完整 性 而 
没有 机 密 性 吗 ? 证 实 你 的 答案 。 

R2. 因特网 实体 〈 路 由 器 、 交 换 机 、DNS 服务 器 、Web 服务 器 、 用 户 端 系统 等 ) 经 常 需要 安全 通信 。 给 
出 三 个 特定 的 因特网 实体 对 的 例子 ， 它 们 要 安全 通信 。 

8.2 节 

R3. 从 服务 的 角度 ， 对 称 密 钥 系统 和 公开 密 钥 系统 之 间 一 个 重要 的 差异 是 什么 ? 

R4. 假定 某 人 侵 者 拥有 一 个 加 密 报 文 以 及 该 报 文 的 解密 版 本 。 这 个 人 侵 者 能 够 发 起 已 知 密 文 攻击 、 已 知 
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R7. 
R8. 
8.3 
R9. 


R10. 
R11. 


R12. 
R13. 
R14. 


R15. 


R16. 


R17. 
R18. 


8.5 


R19. 


8.9 


R29. 
R30. 


R31. 
R32. 


明文 攻击 和 选择 明文 攻击 吗 ? 


. 考虑 一 个 8 块 密码 。 这 个 密码 有 多 少 种 可 能 的 输入 块 ? 有 多 少 种 可 能 的 映射 ? 如 果 我 们 将 每 种 映射 


视 为 一 个 密 钥 ， 则 该 密码 具有 多 少 种 可 能 的 密 钥 ? 


. 假定 入 个 人 中 的 每 个 人 都 和 其 他 入-1 个 人 使 用 对 称 密 钥 密码 通信 。 任 两 人 (i 和 j) 之 间 的 所 有 通 


信 对 该 N 个 人 的 组 中 的 所 有 其 他 人 都 是 可 见 的 ， 且 该 组 中 的 其 他 人 都 不 应 当 能 够 解密 他 们 的 通信 。 
则 这 个 系统 总 共 需 要 多 少 个 密 钥 ? 现在 假定 使 用 公开 密 钥 密码 。 此 时 需要 多 少 个 密 钥 ? 
假定 n=10000、a=10023 和 4&6=10004。 请 你 使 用 等 同 的 模 算术 来 心算 (a-b) mod n。 
假设 你 要 通过 加 密 对 应 于 报 文 1010111 的 十 进 制 数 来 加 密 该 报 文 。 该 十 进 制 数 是 什么 ? 
~8.4 节 
散 列 以 何 种 方式 提供 比 检验 和 ( 如 因特网 检验 和 ) 更 好 的 报 文 完整 性 检验 ? 
你 能 够 “解密 ” 某 报 文 的 散 列 来 得 到 初始 报 文 吗 ? 解释 你 的 答案 。 
考虑 MAC 算法 (图 8-9) 的 一 种 变形 算法 ， 其 中 发 送 方 发 送 (m, H(m) +s), XE H(m) +s È 
H(m) 和 s 的 级 联 。 该 变形 算法 有 和 缺陷 吗 ? 为 什么 ? 
一 个 签名 的 文档 是 可 鉴别 的 和 不 可 伪造 的 ， 其 含义 是 什么 ? 
公 钥 加 密 的 报 文 散 列 以 何 种 方式 比 使 用 公 钥 加 密 报 文 提供 更 好 的 数字 签名 ? 
假设 certifier. com 生成 一 个 用 于 foo. com 的 证 书 。 通 常 整个 证 书 将 用 certifier. com 的 公 钥 加 密 。 这 种 
说 法 是 正确 还 是 错误 ? 
假设 Alice 有 一 个 准备 发 送 给 任何 请 求 者 的 报 文 。 数 以 千 计 的 人 要 获得 Alice 的 报 文 ， 但 每 个 人 都 要 
确保 该 报 文 的 完整 性 。 在 这 种 场景 下 ， 你 认为 是 基于 MAC 还 是 基于 数字 签名 的 完整 性 方案 更 为 适 
合 ? 为 什么 ? 
在 某 端 点 鉴别 协议 中 ， 使 用 不 重 数 的 目的 是 什么 ? 
我 们 说 一 个 不 重 数 是 一 个 在 生存 期 中 只 使 用 一 次 的 值 ， 这 意味 着 什么 ?其 中 是 指 谁 的 生存 期 ? 
基于 HMAC 的 报 文 完 整 性 方案 易 受 重 放 攻击 影响 吗 ? 如 果 是 ， 能 够 在 方案 中 综合 一 个 不 重 数 来 去 除 
这 种 脆弱 性 吗 ? 
~8.8 节 
假定 Bob 从 Alice 处 接收 一 个 PGP 报 文 。Bob 怎样 才能 确定 Alice (而 不 是 如 Trudy) 生成 了 该 报 文 ? 
PGP 为 保证 报 文 完整 性 使 用 了 MAC 吗 ? 


. 在 SSL 记录 中 ， 有 一 个 字段 用 于 SSL 序号 。 这 种 说 法 是 正确 还 是 错误 ? 

. 在 SSL 握手 中 随机 不 重 数 的 目的 是 什么 ? 

. 假设 某 SSL 会 话 应 用 了 具有 CBC 的 块 密码 。 服 务 器 以 明文 向 客户 发 送 了 IV。 这 种 说 法 是 正确 还 是 错误 ? 
. 假设 Bob 向 Trudy 发 起 一 条 TCP 连接 ， 而 Trudy 正在 伪装 她 是 Alice。 在 握手 期 间 ，Trudy 向 Bob 发 


i& Alice 的 证 书 。 在 SSL 握手 算法 的 哪 一 步 ，Bob 将 发 现 他 没有 与 Alice 通信 ? 


. 考虑 使 用 IPsec 从 主机 A 向 主机 B 发 送 分 组 流 。 通 常 ， 为 该 流 中 的 每 个 发 送 分 组 将 创建 一 个 新 SA。 


这 种 说 法 是 正确 还 是 错误 ? 


. 假设 在 图 8-28 中 总 部 和 分 支 机 构 之 间 通 过 IPsec 运行 TCP。 如 果 TCP 重新 传输 相同 的 分 组 ， 则 由 


R1 发 送 的 两 个 对 应 的 分 组 将 在 ESP 首部 中 具有 相同 的 序号 。 这 种 说 法 是 正确 还 是 错误 ? 


. IKE SA 和 IPsec SA 是 相同 的 东西 。 这 种 说 法 是 正确 还 是 错误 ? 
. 考虑 802. 11 的 WEP. 假定 数据 是 10101100 并 且 密 钥 流 是 11110000。 相 应 的 密 文 是 什么 ? 
R28. 


在 WEP 中 ,在 每 个 帧 中 以 明文 发 送 IV。 这 种 说 法 是 正确 还 是 错误 ? 

节 

状态 分 组 过 滤器 维护 两 个 数据 结构 。 给 出 它们 的 名 字 并 简单 地 讨论 它们 做 些 什么 。 

考虑 某 传统 的 〈 无 状态 的 ) 分 组 过 滤器 。 该 分 组 过 滤器 可 能 基于 TCP 标志 位 以 及 其 他 首部 字段 过 
滤 分 组 。 这 种 说 法 是 正确 还 是 错误 ? 

在 传统 的 分 组 过 滤器 中 ， 每 个 接口 能 够 具有 自己 的 访问 控制 表 。 这 种 说 法 是 正确 还 是 错误 ? 

为 什么 应 用 程序 网 关 必须 与 分 组 过 滤器 协同 工作 才能 有 效 ? 
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R33. 基于 特征 的 IDS 和 IPS 检查 TCP 和 UDP 报 文 段 的 载荷 。 这 种 说 法 是 正确 还 是 错误 ? 
KL 
Ze 


Pl. 使 用 图 8-3 中 的 单 码 代替 密码 ， 加 密 报 文 “This is an easy problem”， 并 解密 报 文 “rmij'u uamu xyj”。 

P2. Trudy 使 用 了 已 知 明文 攻击 ， 其 中 她 知道 了 7 个 字母 的 〈 密 文 ， 明 文 ) 转换 对 ， 减 少 了 8.2.1 节 的 例 
子 中 将 被 检查 的 大 约 10° 数量 级 的 可 能 替换 的 数量 。 请 说 明之 。 

P3. 考虑 图 8-4 所 示 的 多 码 代 替 密 码 系 统 。 利 用 报 文 “The quick brown fox jumps over the lazy dogs” 得 到 
的 明文 编码 ， 选 择 明文 攻击 足以 破解 所 有 报 文 吗 ” 为 什么 ? 

P4. 考虑 图 8-5 中 显示 的 块 密码 。 假 设 每 个 块 密码 T, 只 是 反 转 了 8 个 输入 比特 的 次 序 (例如 ,使 得 
11110000 变 为 00001111)。 进 一 步 假设 64 比特 置 乱 函 数 不 修 改 任何 比特 (使 得 第 m 个 比特 的 输出 值 
等 于 第 m 个 比特 的 输入 值 ) 。 

a. 对 于 n=3 和 初始 64 比特 输入 等 于 10100000 重复 了 8 vk, 输出 的 值 是 多 少 ? 
b. 重复 (a), 但 此 时 将 初始 64 比特 的 最 后 一 个 比特 从 0 变 为 1。 
c. 重复 (a) 和 (b) ， 但 此 时 假定 64 比特 的 置 乱 函 数 反 转 了 64 比特 的 次 序 。 

P5. 考虑 图 8-5 中 的 块 密码 。 对 于 给 定 的 “ 密 钥 ”，Alice 和 Bob 将 需要 8 个 表 ， 每 张 表 8 比特 乘 以 8 HE 
特 。 对 于 Alice (或 Bob) 来 说 ， 要 存储 所 有 8 张 表 ， 将 需要 多 少 比特 的 存储 器 ? 这 个 数 如 何 与 一 个 
ER 64 比特 的 块 密码 所 需 的 比特 数 进行 比较 ? i 

P6. 考虑 在 表 8-1 中 的 3 比特 块 密码 。 假 定 明文 是 100100100。 

a. 初始 假设 未 使 用 CBC。 生 成 的 密 文 是 什么 ? 

b. 假设 Trudy 嗅 探 该 密 文 。 假 设 她 知道 正在 应 用 无 CBC 的 一 个 3 比特 块 密码 (但 不 知道 特定 的 密 
码 ) ， 她 能 够 推测 到 什么 ? 

c. 现在 假设 使 用 CBC， 其 中 JIV =111。 产 生 的 密 文 是 什么 ? 

P7. 如 题 : 

a. 使 用 RSA， 选 择 p =3 和 g=11， 采 用 对 每 个 字母 独立 地 加 密 的 方法 加 密 短语 “dog”。 对 已 加 密 报 
文 应 用 解密 算法 恢复 出 原 报 文 。 

b. 重复 (a) ， 而 此 时 加 密 “dog” 作 为 一 个 报 文 m。 

P8. 考虑 具有 p=5 和 g=11 的 RSA, 

a n Fz EA? 

b. 令 e 为 3。 为 什么 这 是 一 个 对 e 的 可 接受 的 选择 ? 

c. 求 d 使 得 de=1 (mod z) 和 aw<160。 

d. EHARA (n, e) 加 密 报 文 m=8。 令 c 表示 对 应 的 密 文 。 显 示 所 有 工作 。 提 示 : 为 了 简化 计算 ， 
使 用 如 下 事实 。 

[ (a mod n) » (b mod n) |mod n = (a+ b)modn 

PO. 在 这 个 习题 中 ,我 们 探讨 Diffie- Hellman(DH) 公 钥 加 密 算 法 ， 该 算法 允许 两 个 实体 协商 一 个 共享 的 
密 钥 。 该 DH 算法 利用 一 个 大 素数 p 和 另 一 个 小 于 的 大 数 gs p Me 都 是 公开 的 〈 因 此 攻击 者 将 知 
道 它们 )。 在 DH F, Alice 和 Bob 每 人 分 别 独立 地 选择 秘密 密 钥 5, M Spo Alice 则 通过 将 g 提高 到 S, 
并 以 为 模 来 计算 她 的 公 钥 四 FAVS, Bob 则 通过 将 g 提高 到 S, 并 以 p 为 模 来 计算 他 的 公 钥 7，。 
此 后 Alice 和 Bob 经 过 因特网 交换 他 们 的 公 钥 。Alice 则 通过 将 Ts 提高 到 S, 并 以 p 为 模 来 计算 出 共享 
密 钥 $。 类 似 地 ，Bob 则 通过 将 T, 提高 到 5s 并 以 p 为 模 来 计算 出 共享 密 钥 5'。 

a. 证 明 在 一 般 情况 下 ，Alice 和 Bob 得 到 相同 的 对 称 密 钥 ， 即 证 明 S=S'。 

b. 对 于 p=11 和 g=2， 假 定 Alice 和 Bob 分 别 选择 私 钥 5, =5 和 Ss =12， 计 算 Alice 和 Bob 的 公 钥 7 
和 Ts。 显示 所 有 计算 过 程 。 

c 接着 (b)， 现 在 计算 共享 对 称 密 钥 S$。 显示 所 有 计算 过 程 。 

d. 提供 一 个 时 序 图 ， 显 示 Diffie- Hellman 是 如 何 能 够 受到 中 间 人 攻击 的 。 该 时 序 图 应 当 具 有 3 条 垂直 
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P16. 


P17. 


P18. 


P19. 
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线 ， 分 别 对 应 Alice, Bob 和 攻击 者 Trudy, 
假定 Alice 要 与 采用 对 称 密 钥 密码 体制 的 Bob 使 用 一 个 会 话 密 钥 Ky 通信。 在 8.2 节 中 ， 我 们 知道 了 
如 何 使 用 公开 密 钥 密码 从 Alice 向 Bob 分 发 该 会 话 密 钥 。 在 本 习题 中 ， 我 们 探讨 不 使 用 公开 密 钥 密 
码 而 使 用 一 个 密 钥 分 发 中 心 (KDC) 分 发 会 话 密 钥 的 方法 。KDC 是 一 个 与 每 个 注册 用 户 共享 独特 的 
秘密 对 称 密 钥 的 服务 器 。 对 于 Alice 和 Bob MA, Ky cnc 和 Ksxme 表 示 了 这 些 密 钥 。 设 计 一 个 使 用 
KDC 向 Alice 和 Bob 分 发 Ks 的 方案 。 你 的 方案 应 当 使 用 三 种 报 文 来 分 发 会 话 密 钥 : 一 种 从 Alice 到 
KDC 的 报 文 ; 一 种 从 KDC 到 Alice 的 报 文 ; 最 后 一 种 是 从 Alice 到 Bob 的 报 文 。 第 一 种 报 文 为 
Kroc(4，B)。 使 用 标记 Kiros Keres S~ ARB 回答 下 列 问 题 。 
a 第 二 种 报 文 是 什么 ? 
b. 第 三 种 报 文 是 什么 ? 
计算 一 个 不 同 于 图 8-8 中 的 两 个 报 文 的 第 三 个 报 文 ， 使 该 报 文具 有 与 图 8-8 中 的 报 文 相同 的 检验 和 。 
假定 Alice 和 Bob 共享 两 个 秘密 密 钥 : 一 个 鉴别 密 钥 S 和 一 个 对 称 加 密 密 钥 5,。 扩 充 图 8-9， 使 之 
提供 完整 性 和 机 密 性 。 ` 
在 BitTorrent P2P 文件 分 发 协议 中 (参见 第 2 章 ) ， 种 子 将 文件 分 割 为 块 ， 并 且 对 等 方 彼 此 重 分 发 这 
些 块 。 不 使 用 任何 保护 ， 一 个 攻击 者 能 够 容易 地 通过 假冒 善意 的 对 等 方 并 向 洪流 中 的 一 部 分 对 等 方 
发 送 假冒 块 来 实施 破坏 。 这 些 未 被 怀疑 的 对 等 方 则 重新 向 其 他 对 等 方 发 送 这 些 假冒 块 ， 其 他 对 等 方 
则 将 再 次 向 甚至 更 多 的 对 等 方 重新 分 发 这 些 假冒 块 。 因 此 ， 对 于 BitTorrent 来 说 ,采用 一 种 机 制 使 
对 等 方 能 验证 一 个 块 的 完整 性 ， 从 而 使 得 假冒 块 无 法 分 发 ， 这 是 至 关 重要 的 。 假 设 当 某 对 等 方 加 入 
一 个 洪流 时 ， 它 初始 从 一 个 完全 受信 任 的 源 得 到 一 个 . torrent 文件 。 描 述 允 许 对 等 方 验证 块 完整 性 
的 一 个 简单 的 方案 。 
OSPF 路 由 选择 协议 使 用 一 个 MAC 而 不 是 数字 签名 来 提供 报 文 完整 性 。 你 认为 选择 MAC 而 未 选择 
数字 签名 的 原因 是 什么 ? 
考虑 图 8-18 中 的 鉴别 协议 ， 其 中 Alice 向 Bob 鉴别 她 自己 ， 我 们 看 来 工作 正常 ( 即 我 们 没有 发 现 其 
中 有 缺陷 )。 现 在 假定 当 Alice 向 Bob 鉴别 她 自己 的 同时 ，Bob 必须 向 Alice 鉴别 他 自己 。 给 出 一 个 
情况 ， 此 时 Trudy 假装 是 Alice， 向 Bob 鉴别 她 自己 是 Alice。( 提 示 : 该 协议 运行 的 顺序 ， 鉴 别 过 程 
可 由 Trudy 或 Bob 发 起 ， 能 够 任意 地 交织 在 一 起 。 特 别 注意 Bob 和 Alice 将 使 用 不 重 数 这 样 一 个 事 
实 ， 如 果 不 小 心 的 话 ， 能 够 恶意 地 使 用 相同 的 不 重 数 。) 
一 个 自然 的 问题 是 我 们 能 否 使 用 一 个 不 重 数 的 公 钥 密码 来 解决 8.4 节 中 的 端点 鉴别 问题 。 考 虑 下 列 
自然 的 协议 :， (DAlice 向 Bob 发 送 报 文 “I am Alice”; QBob 选择 一 个 不 重 数 并 将 其 发 送 给 Alice; 
(@Alice 使 用 她 的 私 铀 来 加 密 该 不 重 数 并 向 Bob 发 送 得 到 的 值 ; @Bob 对 接收 到 的 报 文 应 用 Alice 的 
公 钥 。 因 此 ，Bob 计算 R 并 鉴别 了 Alice, 
a. 画图 表示 这 个 协议 ， 使 用 本 书 中 应 用 的 公 铀 和 私 钥 的 标记 法 。 
b. 假定 未 使 用 证 书 。 描 述 Trudy 怎样 能 够 通过 拦截 Alice 的 报 文 ， 进 而 对 Bob 假装 她 是 Alice 而 成 为 
一 名 “中 间 人 ”。 
图 8-19 显示 了 Alice 必须 执行 PGP 的 操作 ， 以 提供 机 密 性 、 鉴 别 和 完整 性 。 图 示 出 当 Bob 接收 来 自 
Alice 的 包 时 必须 执行 的 对 应 操作 。 
假定 Alice 要 向 Bob 发 送 电子 邮件 。Bob 具有 一 个 公共 - 私有 密 钥 对 (K; ，Ks ) ， 并 且 Alice 具有 
Bob 的 证 书 。 但 Alice 不 具有 公 钥 私 钥 对 。Alice 和 Bob (以 及 全 世界 ) 共享 相同 的 散 列 函 数 H(， ) 。 
a. 在 这 种 情况 下 ， 能 设计 一 种 方案 使 得 Bob 能 够 验证 Alice 创建 的 报 文 吗 ? 如 果 能 ， 用 方 框图 显示 
Alice 和 Bob 是 如 何 做 的 。 
b. 能 设计 一 个 对 从 Alice 向 Bob 发 送 的 报 文 提 供 机 密 性 的 方案 吗 ? 如果 能 ， 用 方块 图 显示 Alice 和 
Bob 是 如 何 做 的 。 
考虑 下 面 对 于 某 SSL 会 话 的 一 部 分 的 Wireshark 输出 。 
a. Wireshark 分 组 112 是 由 客户 还 是 由 服务 器 发 送 的 ? 
b. 服务 器 的 IP 地 址 和 端口 号 是 什么 ? 
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c. 假定 没有 丢 包 和 重 传 ， 由 客户 发 送 的 下 一 个 TCP 报 文 段 的 序号 将 是 什么 ? 
d. Wireshark 分 组 112 包含 了 多 少 个 SSL 记录 ? 
e 分 组 112 包含 了 一 个 主 密 钥 或 者 一 个 加 密 的 主 密 钥 吗 ? 或 者 两 者 都 不 是 ? 


f 假定 握手 类 型 字段 是 1 字 节 并 且 每 个 长 度 字段 是 3 字 节 ， 主 密 钥 〈 或 加 密 的 主 密 钥 ) 的 第 一 个 和 


最 后 一 个 字 节 的 值 是 什么 ? 
g 客户 加 密 的 握手 报 文 考虑 了 多 少 SSL 记录 ? 
h 服务 器 加 密 的 握手 报 文 考虑 了 多 少 SSL 记录 ? 
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( Wireshark 屏幕 截图 的 重印 获得 Wireshark 基金 会 的 许可 ) 
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P20. 8.6.1 节 中 表明 ， 不 使 用 序号 ，Trudy 〈 一 名 中 间 人 ) 能 够 在 一 个 SSL 会 话 中 通过 互 换 TCP 报 文 段 实 
施 破坏 。Trudy 能 够 通过 删除 一 个 TCP 报 文 段 做 某 种 类 似 的 事情 吗 ? 在 该 删除 攻击 中 ， 她 需要 做 什 


P21. 


P22. 


么 才能 成 功 ? 它 将 具有 什么 影响 ? 


假定 Alice 和 Bob 通过 一 个 SSL 会 话 通信 。 假 定 一 个 没有 任何 共享 密 钥 的 攻击 者 ， 在 某 分 组 流 中 捅 
人 一 个 假冒 的 TCP 报 文 段 ， 该 报 文 段 具有 正确 的 TCP 检验 和 及 序号 (以 及 正确 的 人 P 地 址 和 端口 


号 ) 。 在 接收 侧 SSL 将 接受 该 假冒 分 组 并 传递 载荷 给 接收 应 用 程序 吗 ? 为 什么 ? 


下 列 是 有 关 图 8-28 的 判断 题 。 

a MFE 172. 16. 1/24 中 的 主机 向 一 台 Amazon. com 服务 器 发 送 一 个 数据 报时 ， 路 由 器 RI 将 使 用 
IPsec 加 密 该 数据 报 。 

b. 当 在 172. 16. 1/24 中 的 主机 向 在 172. 16. 2/24 中 的 主机 发 送 一 个 数据 报时 ， 路 由 器 RI 将 改变 该 


IP 数据 报 的 源 和 目的 地 址 。 


c. 假定 在 172. 16. 1/24 中 的 主机 向 在 172. 16. 2/24 中 的 Web 服务 器 发 起 一 个 TCP 连接 。 作 为 此 次 连 


接 的 一 部 分 ， 由 RI 发 送 的 所 有 数据 报 将 在 IPv4 首部 字段 最 左边 具有 协议 号 50。 


d. 考虑 从 在 172 16. 1/24 中 的 主机 向 在 172. 16. 2/24 中 的 主机 发 送 一 个 TCP 报 文 段 。 假 定 对 该 报 文 段 的 应 


BERT, Alt TCP 重新 发 送 该 报 文 段 。 因 为 IPsec 使 用 序号 ，RI1 将 不 重新 发 送 该 TCP 报 文 段 。 


P23. 考虑 图 8-28 中 的 例子 。 假 定 Trudy 是 中 间 人 ， 她 能 够 在 从 RI 和 R2 发 出 的 数据 报 流 中 插入 数据 报 。 
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作为 重 放 攻击 一 部 分 ，Trudy 发 送 一 个 从 RI 到 R2 发 送 的 数据 报 的 元 余 副本 。R2 将 解密 该 元 余 的 数 

据 报 并 将 其 转发 进 分 支 机构 网 络 吗 ? 如 果 不 是 ， 详 细 描 述 R2 如 何 检测 该 元 余 的 数据 报 。 

P24. 考虑 下 列 伪 WEP 协议 。 其 密 钥 是 4 比特 ，IV 是 2 比特 。 当 产生 密 钥 流 时 ，IV 被 附加 到 密 钥 的 后 面 。 
假定 共享 的 密 钥 是 1010。 密 钥 流 的 4 个 可 能 输入 如 下 : 

101000; 0010101101010101001011010100100… 

101001; 1010011011001010110100100101101… 

101010; 0001101000111100010100101001111--- 

101011; 1111101010000000101010100010111--- 

假定 所 有 报 文 都 是 8 比特 长 。 假 定 ICV (完整 性 检查 ) 是 4 比特 长 ， 并 且 通 过 用 数据 的 后 4 比特 异 

或 数据 的 前 4 比特 来 计算 。 假 定 该 伪 WEP 分 组 由 3 个 字段 组 成 : 首先 是 IV 字段 ， 然 后 是 报 文字 段 ， 

最 后 是 ICV 字段 ， 这 些 字段 中 的 某 些 被 加 密 。 

a 我们 希望 使 用 IV =11 和 WEP 发 送 报 文 m =10100000。 在 这 3 个 WEP 字段 中 将 有 什么 样 的 值 ? 

b. 说 明 当 接收 方 解 密 该 WEP 分 组 时 ， 它 恢复 报 文 和 ICV. 

c. 假定 Trudy 截获 了 一 个 WEP 分 组 (并 不 必要 使 用 IV =11) 并 要 在 向 接收 方 转发 前 修改 该 分 组 。 
假定 Trudy 翻转 了 第 一 个 ICV 比特 。 假 定 Trudy 并 不 知道 用 于 任何 IV 的 密 钥 流 ， 则 Trudy 也 必须 
翻转 哪些 其 他 比特 ,使 得 接收 到 的 分 组 通过 ICV 检查 ? 

d. 通过 修改 (a) 中 WEP 分 组 中 的 比特 ,解密 所 生成 的 分 组 ， 并 验证 完整 性 检查 来 评价 你 的 答案 。 

P25. 对 于 尽 可 能 限制 但 能 实现 下 列 功 能 的 一 台 有 状态 防火 墙 ， 提 供 一 张 过 滤器 表 和 一 张 连接 表 : 

a. 人 允许 所 有 的 内 部 用 户 与 外 部 用 户 创建 Telnet 会 话 。 

b. 允许 外 部 用 户 冲 浪 公司 位 于 222. 22. 0.12 的 Web 站 点 。 

c. 否则 阻挡 所 有 入 流量 和 出 流量 。 

内 部 网 络 为 222. 22/16。 在 你 的 答案 中 ,假设 连接 表 当 前 缓存 了 3 个 从 内 向 外 的 连接 。 你 需要 虚构 

适当 的 IP 地 址 和 端口 号 。 

P26. 假设 Alice 要 使 用 TOR 类 似 的 服务 访问 Web 站 点 activist. com。 该 服务 使 用 两 个 不 串通 的 代理 服务 器 
Proxyl 和 Proxy2。Alice 首先 从 某 个 中 央 服 务 器 获得 对 Proxyl 和 Proxy2 的 证 书 (每 个 都 包含 一 个 公 
H AKO KPO. KOAKO 表示 加 密 /解密 时 所 使 用 的 RSA AHA RSA 私 钥 。 

a. 使 用 一 幅 时 序 图 ， 提 供 一 个 ( 尽 可 能 简单 的 ) 协议 允许 Alice 创建 一 个 用 于 Proxyl 的 共享 会 话 密 
H Sio Sim) 表示 为 使 用 共享 密 钥 S 对 数据 m 加 密 / 解 密 。 

b. 使 用 时 序 图 ， 提 供 一 个 〈 尽 可 能 简单 的 ) 协议 允许 Alice 创建 一 个 对 于 Proxy2 的 共享 会 话 密 钥 
S ， 而 不 向 Proxy2 透露 她 的 四 地址 。 

c 现在 假设 创建 了 共享 密 钥 S; 和 $:。 使 用 时 序 图 提供 一 个 协议 〈 尽 可 能 简单 并 且 不 使 用 公开 密 钢 
密码 ) ， 该 协议 允许 Alice 从 activist. com 请 求 一 个 html 页 面 而 不 向 Proxy2 透露 她 的 IP debt, Jf AL 
不 向 Proxyl 透露 她 正在 访问 哪个 站 点 。 你 的 图 应 当 终 止 在 一 个 HTTP 请 求 到 达 activist. com, 


sil Wireshark 实验 


在 这 个 实验 中 〈 与 本 书 配 套 的 Web 站 点 有 可 用 资源 ) ,我 们 研究 安全 套 接 层 (SSL) 协议 。8. 6 节 讲 
过 ,使 用 SSL 使 得 TCP 连接 更 为 安全 ， 为 了 使 因特网 事务 安全 ， 实 践 中 广泛 应 用 了 SSL。 在 本 实验 中 我 
们 关注 经 TCP 连接 发 送 的 SSL 记录 。 我 们 将 试图 对 每 个 记录 定 界 和 分 类 ， 目 标 是 理解 每 个 记录 的 工作 原 
理 和 工作 过 程 。 我 们 研究 各 种 SSL 记录 类 型 以 及 在 SSL 报 文 中 的 字段 。 通 过 分 析 你 的 主机 与 某 电 子 商 务 
服务 器 之 间 发 送 的 SSL 记录 的 踪迹 来 做 这 些 事情 。 





在 这 个 实验 中 (与 本 书 配 套 的 Web 站 点 有 可 用 资源 ) ， 我 们 将 探讨 如 何在 linux 装置 之 间 创 建 IPsec 
SA。 你 能 够 用 两 个 普通 的 linux 装置 做 该 实验 的 第 一 部 分 ， 每 个 装置 配 有 一 块 以 太 网 适配器 。 但 是 对 于 实验 
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的 第 二 部 分 ， 你 将 需要 4 个 linux 装置 ， 这 些 装 置 每 个 都 具有 两 块 以 太 网 适配器 。 在 该 实验 的 第 二 部 分 ， 你 
将 在 隧道 模式 中 使 用 ESP 协议 创建 IPsec SA。 你 做 实验 过 程 是 : 先 人 工 创 建 SA， 然 后 让 IKE 创建 SA。 


E 人 物 专访 — 


Steven M. Bellovin 在 位 于 新 泽 西 州 Florham Park 的 AT&T 实验 研究 所 的 
网 络 服务 研究 实验 室 工作 多 年 后 ， 成 为 哥伦比亚 大 学 的 教师 。 他 的 研究 重 
点 是 网 络 和 安全 ， 以 及 将 两 者 有 机 结合 起 来 。1995 年 ， 因 创立 了 Usenet, 
即 第 一 个 连接 两 个 或 多 个 计算 机 并 允许 用 户 共 享 信息 和 参与 讨论 的 新 闻 组 
交换 网 络 ， 而 被 授予 Usenix 终生 成 就 奖 。Steven 也 是 国家 工程 学 会 的 当选 





成 员 。 他 获得 了 哥伦比亚 大 学 的 学 土 学 位 和 位 于 Chapel Hil 的 北 卡罗来纳 PEN fh 
大 学 的 博士 学 位 。 Hie fi 

fi tf 4h: i 
。 什么 原因 使 您 决定 专注 于 网 络 安全 领域 的 研究 ? AO as 


Steven M. Bellovin 
听 起 来 可 能 很 奇怪 ， 但 是 答案 却 很 简单 : 只 是 因为 感 兴趣 而 已 。 我 以 前 的 


背景 是 从 事 系统 编程 和 系统 管理 ， 这 很 自然 就 发 展 到 安全 领域 了 。 而 且 我 一 直 对 通信 很 感 兴趣 ， 这 可 以 
追溯 到 我 还 在 上 大 学 时 ， 就 兼职 做 系统 编程 方面 的 工作 。 

我 在 安全 领域 的 工作 持续 受到 两 个 因素 的 激励 : 一 个 是 希望 计算 机 有 用 ， 这 意味 着 它们 的 功能 不 会 
被 攻击 者 破坏 ， 另 一 个 是 希望 保护 隐私 。 i 

。 当初 您 在 研发 Usenet 时 ， 您 对 它 的 愿景 是 什么 ? 现在 呢 ? 

我 们 最 初 将 它 看 作 是 一 种 能 够 在 全 国 范围 内 讨论 计算 机 科学 和 计算 机 编程 的 手段 ， 考 虑 了 用 于 事务 
管理 和 广告 销售 等 目的 的 许多 本 地 使 用 情况 。 事 实 上 ， 我 最 初 的 预测 是 ， 每 天 从 至 多 50 ~ 100 个 站 点 有 
1 ~2 个 报 文 。 但 是 实际 增长 是 与 人 相关 的 主题 方面 ， 包 括 〈 但 不 限于 ) 人 与 计算 机 的 相互 作用 。 这 么 多 
年 来 ， 我 喜欢 的 新 闻 组 有 rec. woodworking 以 及 sci. crypt. 

在 某 种 程度 上 ， 网 络 新 闻 已 经 被 Web 取代 。 如 果 现在 要 我 再 设计 它 的 话 ， 就 会 和 那 时 的 设计 大 不 相 
同 了 。 但 是 它 仍然 是 沟通 对 某 一 主题 感 兴 趣 的 大 量 读者 的 一 种 极 好 手段 ， 而 不 必 依赖 特定 的 Web 站 点 。 

。 是 否 有 人 给 过 您 专业 上 的 启示 和 灵感 ? 以 什么 样 的 方式 呢 ? 

Fred Brooks 教授 对 我 的 专业 生涯 影响 重大 。 他 是 位 于 Chapel Hill 的 北 卡罗来纳 大 学 计算 机 科学 系 的 
创立 者 和 原 系 主任 ， 是 研发 IBM S/360 和 0S/360 团队 的 管理 者 。 他 也 是 “The Mythical Man Mouth” 
(《 人 月 神话 》) 的 作者 。 最 重要 的 是 ， 他 教 给 我 们 展望 和 折 中 的 方法 ， 即 如 何在 现实 世界 环境 中 观察 问 
题 (不 论 这 个 现实 世界 比 理论 上 的 要 复杂 多 少 倍 ) ， 以 及 在 设计 一 种 解决 方案 时 如 何平 衡 竞争 各 方 的 利 
益 。 大 部 分 计算 机 工作 都 是 工程 性 的 ， 正 确 折 中 的 艺术 能 够 满足 许多 相 了 矛盾 的 目标 。 

。 您 对 未 来 的 联网 和 安全 性 的 展望 是 什么 ? 

到 目前 为 止 ， 我 们 所 具有 的 安全 性 大 多 来 自 隔离 。 例 如 ， 防火 墙 的 工作 是 通过 切断 基 些 机 器 和 服务 
实现 的 。 但 是 我 们 正 处 在 增加 连通 性 的 时 代 ， 这 使 得 隔离 变 得 更 为 困难 。 更 糟糕 的 是 ,我 们 的 生产 性 系 
统 要 求 的 远 不 止 是 分 离 的 部 件 ， 而 需要 通过 网 络 将 它们 互联 起 来 。 我 们 面临 的 最 大 挑战 之 一 是 使 所 有 都 
安全 。 

。 您 认为 在 安全 性 方面 已 经 取得 的 最 大 进展 是 什么 ? 未 来 我 们 还 能 有 多 大 作为 ? 

至 少 从 科学 上 讲 ， 我 们 知道 了 密码 学 的 原理 。 这 是 非常 有 帮助 的 。 但 是 多 数 安全 性 问题 因为 其 代码 
错误 成 堆 而 成 为 非常 困难 的 问题 。 事 实 上 ， 它 是 计算 机 科学 中 悬而未决 的 老 问 题 ， 并 且 我 认为 该 问题 仍 
会 持续 。 挑 战 在 于 弄 明白 : 当 我 们 不 得 不 使 用 不 安全 的 组 件 构 建安 全 的 系统 时 ， 如 何 才 能 让 系统 安全 。 
我 们 面 对 硬 件 故障 已 经 能 够 解决 可 靠 性 问题 了 ; 面 对 安 全 性 问题 ， 我 们 是 否 能 够 做 到 这 一 点 呢 ? 

。 您 对 进入 因特网 和 网 络 安全 领域 的 学 生 有 什么 忠告 吗 ? 

学 习 各 种 安全 机 制 是 件 容易 的 事 。 学 习 如 何 “ 思 维 多 疑 ”是 困难 的 。 你 必须 记 住 概率 分 布 在 下 列 场 
合并 不 适用 ， 即 攻击 者 能 够 发 现 不 可 能 的 情况 。 细 节 情 况 不 胜 枚 举 。 
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位 于 世界 各 个 角落 的 人 们 懒散 地 靠 坐 在 床上 或 乘坐 公共 汽车 和 地 铁 打发 时 间 时 ， 眼 下 
都 使 用 因特网 来 按 需 观看 电影 和 电视 节目 。 因 特 网 电影 和 电视 分 发 公司 (如 北美 的 Netflix 
和 Amazon、 中 国 的 “优酷 ”( Youku) 和 “看 看 ” (Kankan) ) 实际 上 已 经 成 为 家 喻 户 晓 
的 品牌 。 而 人 们 不 仅 观 看 因特网 视频 ， 他 们 也 使 用 诸如 YouTube 这 样 的 站 点 来 上 载 和 分 发 
用 户 自己 生成 的 内 容 ， 不 仅 成 为 因特网 视频 的 消费 者 ， 也 成 为 视频 的 生产 者 。 此 外 ， 网 络 应 
用 如 Skype, Google Talk 和 微 信 (WeChat 在 中 国 极为 流行 )， 不仅 允许 人 们 经 过 因特网 打 
“电话 ”， 而 且 可 以 用 视频 和 和 多方 会 议 来 强化 这 些 电话 。 事 实 上 ， 我们 能 够 确定 地 预测 : 到 当 
前 年 代 未 ， 几 乎 所 有 的 视频 消费 和 语音 会 话 都 将 在 因特网 的 端 到 端 发 生 ， 通 常 更 多 是 以 无 线 
终端 方式 经 蜂窝 和 WiFi 接 和 网 与 因特网 相连 接 。 传 统 的 电话 和 广播 电视 正 快速 落伍 。 

本 章 以 9.1 节 中 的 多 媒体 应 用 的 分 类 方法 开始 。 我 们 将 看 到 多 媒体 应 用 能 够 分 为 流 式 
存储 音频 /视频 、 会 话 式 四 音频 /视频 或 流 式 实况 音频 /视频 等 几 类 。 我 们 将 看 到 这 些 应 用 
类 型 中 的 每 一 类 都 有 自己 独特 的 服务 需求 ， 这 些 需求 与 传统 的 弹性 应 用 如 电子 邮件 、Web 
浏览 和 远程 注册 的 需求 差异 很 大 。 在 9. 2 节 中 ， 我们 较为 详细 地 研究 流 式 视频 。 我 们 将 探 
讨 支撑 流 式 视 频 的 许多 基础 原则 ， 包 括 客 户 缓存 、 预 取 和 对 可 用 带宽 的 适应 性 视频 质量 。 
在 9.3 节 中 ,我 们 研究 会 话 式 语音 和 视频 。 这 种 应 用 不 同 于 弹性 应 用 ， 对 端 到 端 时 延 高 度 
敏感 ， 但 能 够 容忍 偶尔 的 数据 丢失 。 此 时 我 们 将 研究 诸如 适应 性 播放 、 前 向 纠 错 和 差错 掩 
盖 等 技术 是 如 何 减 缓 网 络 引入 的 丢 包 和 时 延 的 。 我 们 还 将 以 学 习 案例 方式 审查 Skypes E 
9.4 节 中 ， 我 们 将 学 习 RIP 和 SIP， 这 是 两 个 用 于 实时 会 话 式 语音 和 视频 应 用 的 协议 。 在 
9.5 节 中 ， 我 们 将 研究 网 络 内 部 的 一 些 机 制 ， 这 些 机 制 能 用 于 区 分 一 类 流量 (如 会 话 式 语 
音 这 样 的 时 延 敏感 应 用 ) 和 其 他 类 型 流量 (如 浏览 Web 网 页 这 样 的 弹性 应 用 ) ， 并 且 在 多 
类 流量 中 提供 区 分 服务 。 


9.1 多 媒体 网 络 应 用 


我 们 将 多 媒体 网 络 应 用 定义 为 任何 应 用 音频 或 视频 的 网 络 应 用 。 在 本 节 中 ,我 们 将 提 
供 多 媒体 应 用 的 分 类 法 。 我 们 将 看 到 在 该 分 类 法 中 的 每 类 应 用 都 具有 自己 独特 的 服务 要 求 
和 设计 问题 集合 。 但 在 深入 讨论 因特网 多 媒体 应 用 前 ， 考 虑 音频 和 视频 媒体 自身 的 内 在 特 
点 是 有 用 的 。 


9.1.1 视频 的 性 质 


视频 最 为 显著 的 特点 或 许 是 它 的 高 比特 率 (high bit rate)。 经 因特网 分 发 的 视频 的 典 
型 传输 速率 从 用 于 低 质 量 视频 会 议 的 100kbps 到 用 于 流 式 高 分 辩 率 电影 的 3Mbps。 为 了 比 
较 视 频带 宽 需 求 与 其 他 因特网 应 用 的 带宽 需求 的 不 同 ， 我 们 简要 地 考虑 三 个 不 同 的 用 户 ， 
他 们 每 人 使 用 了 一 种 不 同 的 因特网 应 用 。 第 一 位 用 户 Frank， 他 打算 迅速 将 照片 张贴 到 他 
的 朋友 的 脸 书 页 面 上 。 我 们 假设 Prank 每 10 秒 查 找 一 次 新 照片 ， 并 且 这 些 照片 的 平均 大 小 
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是 200KB。( 与 以 前 一 样 ， 我 们 在 整个 讨论 中 都 简单 地 假定 1KB = 8000 比特 .) 第 二 位 用 
P Martha 正 从 因特网 (“ 云 中 ”) 向 她 的 智能 手机 流 式 传输 音乐 。 我 们 假定 Martha 正在 听 
许多 MP3 歌曲 ， 一 首 接着 一 首 ， 都 以 128kbps 速率 进行 编码 。 第 三 位 用 户 Victor 则 正在 观 
看 以 2Mbps 编码 的 视频 。 最 后 ， 我 们 假设 所 有 三 位 用 户 的 会 话 长 度 是 4000 秒 (大 约 67 分 
钟 ) 。 表 9-1 比较 了 这 三 位 用 户 的 比特 率 和 传输 的 总 字 节 。 我 们 看 到 这 时 流 式 视频 消耗 了 
最 多 的 带宽 ， 其 比特 率 比 脸 书 和 流 式 音乐 应 B 
用 的 带宽 大 10 倍 。 因 此 ， 当 设计 网 络 视频 表 9-1 三 种 因特网 应 用 的 比特 率 需求 的 比较 
应 用 时 ， 我 们 心中 必须 记 住 的 第 一 件 事 是 视 oes 
频 的 高 比特 率 需求 。 鉴 于 视频 的 流行 性 及 其 -i 
高 比特 率 ， 也 许 不 会 对 思科 公司 的 以 下 预测 
感到 惊讶 [Cisco 2015]: 到 了 2019 年 ， 流 
式 视频 和 存储 视频 将 大 约 占 全 球 因特网 流量 消费 的 90% 。 

视频 的 另 一 种 重要 特点 是 它 能 被 压缩 ， 因 而 要 在 视频 质量 与 比特 率 间 进 行 折 中 。 视 频 
是 一 个 图 像 序列 ， 图 像 通常 以 恒定 的 速率 显示 ， 例 如 每 秒 24 幅 或 30 幅 图 像 。 一 个 没有 压 
缩 、 数 字 编 码 的 图 像 由 像素 阵列 组 成 ， 每 个 像素 被 编码 为 一 定数 量 的 比特 来 表示 亮度 和 颜 







160kbps 
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色 。 在 视频 中 有 两 种 类 型 的 元 余 ， 它 们 都 可 以 用 来 进行 视频 压缩 (video compression), % - 


间 兄 余 是 给 定 图 像 的 内 部 宛 余 。 从 直觉 上 讲 , 一 个 主要 由 空白 组 成 的 图 像 具 有 高 度 的 元 
R, 能够 有 效 地 压缩 而 不 会 明显 降低 图 像 质 量 。 时 域 宛 余 反映 一 幅 图 像 和 后 续 图 像 的 重复 
程度 。 例 如 ， 如 果 一 幅 图 像 和 后 续 图 像 完全 一 致 ， 没 有 理由 对 后 续 图 像 再 进行 编码 ; 相 
反 ， 在 编码 过 程 中 直接 指出 后 续 图 像 是 完全 一 样 的 则 更 为 有 效 。 今 天 现成 的 压缩 算法 能 够 
将 视频 压缩 为 所 希望 的 任何 基本 比特 率 。 当 然 ， 比 特 率 越 高 ， 图 像 质量 越 好 ， 总 体 用 户 视 
党 体验 也 越 好 。 

我 们 也 能 够 使 用 压缩 来 生成 相同 视频 的 多 重 版 本 (multiple version) ， 每 个 版 本 有 不 同 
的 质量 等 级 。 例 如 ， 我 们 能 够 使 用 压缩 生成 相同 视频 的 三 个 版 本 ， 速 率 分 别 为 300kbps、 
1Mbps 和 3Mbps。 用 户 则 能 够 根据 他 们 的 当前 可 用 带宽 来 决定 要 观看 哪个 版 本 。 具 有 高 速 
因特网 连接 的 用 户 可 以 选择 3Mbps 的 版 本 ; 使 用 智能 手机 经 过 3G 观看 视频 的 用 户 可 以 选 
择 300kbps 的 版 本 。 类 似 地 ， 在 视频 会 议 应 用 中 的 视频 能 被 “动态 ”(on-the-fly) 地 压缩 ， 
以 在 会 话 用 户 之 间 给 定 的 可 用 端 到 端 带宽 上 提供 最 好 的 视频 质量 。 


9. 1.2 音频 的 性 质 


数字 音频 (包括 数字 化 语音 和 音乐 ) 的 带宽 需求 比 视频 低 得 多 。 然 而 ， 数 字音 频 具 有 
自己 独特 的 性 质 ， 当 设计 多 媒体 应 用 时 必须 考虑 这 些 性 质 。 为 了 理解 这 些 性 质 ， 我 们 首先 
考虑 模拟 音频 (由 人 和 乐器 所 产生 ) 是 如 何 转换 为 数字 信和 号 的 : 

。 模拟 音频 信号 首先 以 某 种 固定 速率 采样 ， 例 如 每 秒 8000 个 样本 。 每 个 采样 值 是 一 

个 任意 的 实数 。 
。 然后 每 个 采样 值 被 “四 舍 五 人 ”为 有 限 个 数值 中 的 一 个 。 这 种 操作 被 称 为 量化 
(quantization) 。 这 些 有 限 个 数值 ( 称 为 量化 值 ) 通常 是 2 的 寡 ， 例 如 256 个 量化 值 。 
。 每 个 量化 值 由 固定 数量 的 比特 表示 。 例 如 ， 如 果 有 256 个 量化 值 ， 那 么 每 个 值 
(因此 每 个 音频 采样 ) 用 一 个 字 节 来 表示 。 所 有 样本 的 比特 表示 级 联 在 一 起 就 形成 
了 该 信号 的 数字 表示 。 举 例 来 说 ， 如 果 一 个 模拟 信号 以 每 秒 8000 个 样 值 采样 ， 而 
且 每 个 样本 被 量化 并 用 8 比特 表示 ， 则 得 到 的 数字 信和 号 的 速率 就 为 每 秒 64 000 HE 
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特 。 通 过 音频 扬声器 播放 ， 这 个 数字 信号 则 能 够 转换 回来 〈 也 就 是 解码 )， 形 成 一 
个 模拟 信号 。 然 而 ， 解 码 后 的 模拟 信号 仅 是 初始 信号 的 近似 ， 并 且 声音 质量 也 许 
有 明显 的 下 降 (例如 ， 高 频 的 声音 可 能 在 解码 信号 中 丢失 了 ) 。 通 过 增加 采样 速率 
和 量化 值 的 数量 ， 解 码 信号 能 够 更 好 地 接近 初始 的 模拟 信号 。 因 此 (与 视频 一 
样 ) ， 在 解码 信号 的 质量 和 比特 率 与 数字 信号 存储 空间 之 间 存 在 一 种 折 中 。 

我 们 刚才 描述 的 基本 编码 技术 称 为 脉冲 编码 调制 (Pulse Code Modulation, PCM). if 
音 编码 通常 采用 PCM， 采 样 速率 为 每 秒 8000 个 样本 ， 每 个 样本 用 8 比特 表示 ， 得 到 
64kbps 的 速率 。 音 频 光 盘 (CD) 也 使 用 PCM， 采 样 速率 为 每 秒 44 100 个 样本 ， 每 个 样本 
用 16 比特 表示 ; 这 样 使 得 单 声 道 速率 为 705. 6kbps， 立 体 声速 率 为 1. 411Mbps。 

然而 ，PCM 编码 的 语音 和 音乐 很 少 在 因特网 中 使 用 。 与 视频 一 样 ， 取 而 代 之 的 是 使 用 
压缩 技术 来 减 小 流 的 比特 速率 。 人 类 语音 能 被 压缩 到 小 于 10kbps 并 仍然 可 懂 。 一 种 接近 
CD 质量 立体 声音 乐 的 流行 压缩 技术 是 MPEG 1 第 3 层 ， 更 通常 的 叫 法 是 MP3。MP3 编码 
器 通常 能 够 压缩 为 许多 不 同 的 速率 ; 128kbps 是 最 常 使 用 的 编码 速率 ， 并 且 能 够 产生 非常 
小 的 声音 失真 。 一 种 相关 的 标准 是 高 级 音频 编码 (Advanced Audio Coding, AAC), WERNE 
已 经 随 苹果 公司 而 流行 起 来 。 与 视频 一 样 ， 能 够 以 不 同 的 比特 率 生 成 多 重 版 本 的 预先 录制 
的 音频 流 。 

尽管 音频 比特 率 通常 比 视频 的 比特 率 小 得 多 ， 但 用 户 通常 对 音频 的 小 失误 比 视频 的 小 
失误 更 为 敏感 。 例 如 ， 考 虑 在 因特网 上 举行 的 视频 会 议 。 如 果 视 频 信号 时 不 时 地 丢失 几 
秒 ， 该 视频 会 议 很 可 能 继续 进行 而 没有 太 多 的 用 户 抱怨 。 然 而， 如 果 音 频 信号 经 常 丢失 ， 
用 户 就 可 能 不 得 不 中 止 该 会 话 。 


9.1.3 多 媒体 网 络 应 用 的 类 型 


因特网 能 够 支持 各 种 各 样 有 用 的 和 娱乐 性 的 多 媒体 应 用 = 在 本 小 节 中 ,我 们 将 多 媒体 应 
用 分 为 三 个 大 类 : @@D 流 式 存 储 音频 /视频 ; DAER P 语音 /视频 ; @@ 流 式 实况 音频 /视频 。 
如 我 们 很 快 将 看 到 的 那样 ， 这 些 应 用 类 型 中 的 每 种 都 有 自己 的 服务 需求 和 设计 问题 的 集合 。 
1. 流 式 存储 音频 和 视频 


为 使 讨论 具体 化 ， 我 们 这 里 聚焦 流 式 存储 视频 ， 它 通常 结合 了 视频 和 音频 组 件 。 流 式 
存储 音频 (例如 流 式 音乐 ) 非常 类 似 于 流 式 存 储 视 频 ， 尽 管 它 的 比特 率 通 常 要 低 得 多 。 
在 这 类 应 用 中 ， 依 赖 的 媒体 是 预先 录制 的 视频 (如 电影 、 电 视 节目 ) 预先 录制 的 体育 
赛事 或 预先 录制 的 用 户 生 成 的 视频 (如 常 在 YouTube 上 看 到 的 那些 ) 。 这 些 预 先 录 制 的 视 
频 放 置 在 服务 器 上 ， 用 户 向 服务 器 发 送 请 求 按 需 观看 视频 。 许 多 因特网 公司 今天 提供 流 式 
视频 ， 包 括 YouTube (谷歌 ) Netflix, Amazon 和 Hulu。 流 式 存储 视频 具有 三 个 关键 的 不 
同 特色 。 
© 流 。 在 流 式 存 储 视频 应 用 中 ， 客 户 开 始 从 服务 器 接收 文件 几 秒 之 后 ， 通 常 就 开始 
播放 视频 。 这 意味 着 当 客 户 正 在 从 视频 的 一 个 位 置 开始 播放 时 ， 与 此 同时 正在 从 
服务 器 接收 该 视频 的 后 续 部 分 。 这 种 技术 被 称 为 流 (streaming) ， 它 避免 了 在 开始 
播放 之 前 必须 下 载 整个 视频 (并且 引起 一 个 潜在 的 长 时 延 ) 。 
e 相互 作用 。 因 为 媒体 是 预先 录制 的 ， 用户 可 以 对 多 媒体 内 容 进行 暂停 、 重 新 配置 
前 进 、 重 新 配置 倒退 、 快 进 等 操作 。 从 一 个 客户 提出 这 种 请 求 到 该 动作 在 客户 端 
表现 出 来 ， 可 接受 的 响应 时 间 应 该 小 于 几 秒 。 
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。 连续 播放 。 一 旦 视频 开始 播放 ， 它 应 该 根据 初始 记录 的 时 序 进行 。 因 此 ， 为 了 在 
客户 端 播放 ， 必 须 从 服务 器 中 及 时 接收 数据 ;和 否则， 用 户 经 历 视频 帧 停滞 (这 时 
客户 等 待 延 迟 的 帧 ) 或 帧 跳 过 〈 这 时 客户 漏 掉 延迟 的 帧 ) 。 

到 目前 为 止 ， 对 流 式 视 频 最 重要 的 性 能 测度 是 平均 吞吐 量 。 为 了 提供 连续 的 播放 ， 网 
络 为 流 式 应 用 提供 的 平均 吞吐 量 必须 至 少 与 该 流 视 频 本 身 的 比特 率 一 样 大 。 如 我 们 将 在 
ot 通过 使 用 缓存 和 预 取 ， 即 使 在 吞吐 量 波动 的 时 候 ， 提 供 连 续 播放 也 是 可 能 

只 要 平均 吞吐 量 (在 5 ~ 10 秒 区 间 平 均 ) 保持 在 视频 速率 之 上 [Wang 2008]。 

”对 于 许多 流 式 视频 颈 应 用 ， 预 先 录 制 的 视频 被 存储 起 来 ,并 且 从 CDN 而 非 从 单一 的 数 
据 中 心 流 式 播放 。 也 有 许多 P2P 视频 流 式 应 用 ， 其 中 视频 被 存储 在 用 户主 机 _( 对 等 方 ) 
上 ， 不 同 视频 块 从 可 能 分 布 在 全 球 的 不 同 对 等 方 到 达 。 在 得 知 了 因特网 流 式 视频 的 性 能 
后 ， 我 们 将 在 9. 2 节 更 加 深入 地 研究 流 式 视频 ， 特 别 关注 客户 缓存 、 预 取 、 对 可 用 带宽 的 
适应 性 质量 和 CDN 分 发 。 

2. 会 话 式 IP 语音 和 视频 


在 因特网 上 的 实时 会 话 式 语音 通常 称 为 因特网 电话 (Internet telephony) ， 因 为 从 用 户 
的 角度 看 ， 它 类 似 于 传统 的 电路 交换 电话 服务 。 它 也 常 被 称 为 IP 语音 ( Voice- over- IP, 
VoIP) 。 会 话 式 视频 与 之 类 似 ， 除 了 它 包括 参与 者 的 语音 以 及 视频 外 。 今 天 的 大 多 数 语音 
和 视频 会 话 式 系统 允许 用 户 生成 具有 三 个 或 更 多 个 参与 者 的 会 议 。 会 话 式 语 音 和 视频 广泛 
地 应 用 于 今天 的 因特网 中 ， 因 特 网 公司 Skype, QQ 和 Google Talk 自称 每 天 都 有 数 亿 用 户 。 

在 第 2 章 有 关 应 用 服务 需求 的 讨论 中 (图 2-4) ， 我 们 确定 了 一 些 轴 ， 服 务 需 求 可 以 根 
据 它们 分 类 。 其 中 的 两 个 轴 〈 即 定时 考虑 和 数据 丢失 容忍 度 ) 对 会 话 式 语音 和 视频 应 用 万 
其 重要 。 定 时 考虑 是 很 重要 的 ， 因 为 音频 和 视频 会 话 式 应 用 是 高 度 时 延 敏感 ( delay- sensi- 
tive) 的 。 对 于 具有 了 两 个 或 更 多 个 交互 讲话 者 的 会 话 来 说 ， 从 用 户 讲话 或 移动 开始 到 该 动 
作 显 现在 其 他 端的 时 延 应 当 小 于 几 百 毫秒 。 对 于 语音 ， 小 于 150ms 的 时 延 不 会 被 人 类 听 者 
觉察 到 ，150 ~400ms 的 时 延 能 够 被 接受 ， 当 时 延 超过 400ms 时 ， 即 使 不 会 使 对 话 变 得 完 
全 无 法 理解 ， 也 会 使 语音 会 话 变 得 令 人 泪 丧 。 

另 一 个 方面 ， 会 话 式 多 媒体 应 用 容忍 丢 包 (loss-tolerant), ， 即 偶尔 的 丢失 只 会 在 音频 / 视 
频 回放 时 偶尔 出 现 干扰 信号 ,而 且 这 些 丢 失 经 常 可 以 部 分 或 者 全 部 地 隐藏 。 这 些 时 延 敏 感 但 
容忍 丢 包 的 特性 明显 不 同 于 那些 弹性 数据 应 用 (如 Web 浏览 、 电 子 邮 件 、 社 交 网 络 和 远程 
注册 等 ) 的 特性 。 对 于 这 些 弹性 应 用 ， 长 时 延 令 人 烦恼 ， 但 并 不 是 特别 有 害 ， 然 而 传输 数据 
的 完全 和 完整 性 是 首要 的 。 我 们 将 在 9.3 节 中 更 加 深入 地 探讨 会 话 式 语音 和 视频 ， 特 别 关注 
适应 性 播放 、 前 向 纠 错 和 差错 掩盖 是 如 何 减缓 网 络 引 入 的 分 组 丢失 和 时 延 的 。 

3. 流 式 实况 音频 和 视频 

这 种 第 三 类 应 用 类 似 于 传统 的 电台 广播 和 电视 ， 只 是 它 通过 因特网 来 传输 而 已 。 这 些 
应 用 允许 用 户 接收 从 世界 上 任何 角落 发 出 的 实况 无 线 电 广播 和 电视 传输 。 今天 有 数 以 干 
计 、 遍 及 全 球 的 无 线 电 台 和 电视 台 正在 因特网 上 广播 内 容 。 

实况 是 类 似 于 广播 的 应 用 ， 它 们 经 常 有 很 多 接收 相同 音频 /视频 节目 的 客户 。 在 今天 
的 因特网 中 ， 这 种 应 用 通常 是 用 CDN 来 实现 的 (2.6 节 ) 。 由 于 使 用 流 式 存 储 多 媒体 ， 网 
络 必须 为 每 个 实况 多 媒体 流 提供 大 于 该 视频 消耗 速率 的 平均 吞吐 量 。 因 为 事件 是 直播 的 ， 
尽管 定时 限制 没有 会 话 式 语音 那么 严格 ， 但 时 延 也 可 能 成 为 问题 。 从 用 户 选 择 观看 一 个 实 
况 传 输 到 播放 开始 ， 能 够 容忍 的 时 延 最 多 为 10 秒 。 我 们 在 本 书 中 将 不 涉及 流 式 实况 媒体 ， 
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因为 用 于 流 式 实况 媒体 的 许多 技术 ( 如 初始 缓存 时 延 、 适 应 性 带宽 使 用 和 CDN 分 发 ) 都 
类 似 于 流 式 存储 媒体 所 使 用 的 技术 。 


9.2 流 式 存储 视频 


对 于 流 式 视 频 应 用 ， 预 先 录 制 的 视频 放置 在 服务 器 上 ， 用 户 向 这 些 服务 器 发 送 请 求 按 
需 观 看 这 些 视频 。 用 户 可 能 从 开始 到 结束 都 在 观看 视频 而 没有 中 断 它 ， 也 可 能 在 视频 结束 
前 停止 观看 它 ， 或 者 通过 暂停 、 重 新 定位 到 后 面 或 前 面 镜头 来 与 视频 交互 。 流 式 视频 系统 
可 分 为 三 种 类 型 : UDP 流 (UDP streaming), HTTP 流 (HTTP streaming) 和 适应 性 HTTP 
流 (adaptive HTTP streaming) (参见 2.6 节 )。 尽 管 在 实践 中 所 有 这 三 种 系统 都 在 使 用 ， 
但 绝 大 多 数 今天 的 系统 应 用 了 HTTP 流 和 适应 性 HTTP 流 。 

所 有 这 三 种 形式 的 视频 流 的 共同 特点 是 广泛 使 用 了 客户 端 应 用 缓存 ， 以 此 来 缓解 变化 
的 端 到 端 时 延 和 变化 的 服务 器 和 客户 之 间 可 用 带宽 量 的 影响 。 对 于 流 式 视频 (存储 的 和 实 
况 的 ) ， 用 户 通常 能 够 容忍 在 客户 请 求 菜 视频 与 该 流 视频 在 客户 端 播放 之 间 有 有 几 秒 的 初始 
小 时 延 。 所 以 ， 当 视频 开始 到 达 客 户 时 ， 客 户 不 必 立 即 开始 播放 ， 反 而 能 够 在 应 用 程序 组 
存 中 建立 该 视频 的 储备 。 一 旦 该 客户 建立 起 几 秒 “ 已 缓存 但 尚未 播放 ”的 视频 储备 ， 客 户 
就 可 以 开始 视频 播放 了 。 这 种 客户 缓存 (client buffering) 具有 两 种 重要 的 优点 。 第 一 ， 客 
户 端 缓存 能 够 吸收 服务 器 到 客户 时 延 中 的 波动 。 如 果 某 特殊 部 分 的 视频 数据 延迟 了 ， 只 要 
它 在 “接收 到 但 尚未 播放 ”的 视频 耗 尽 之 前 到 达 ， 这 个 长 时 延 将 不 会 被 注意 到 。 第 二 ， 如 
果 服 务 器 到 客户 带宽 暂时 低 于 视频 消耗 速率 ， 用 户 能 够 继续 享受 连续 的 播放 ， 只 要 客户 应 
用 缓存 仍 没有 完全 排 尽 。 

图 9-1 显示 了 客户 端的 缓存 。 在 这 个 例子 中 ,假定 视频 以 固定 的 比特 率 编码 ， 因 此 每 
个 视频 块 包 含 了 能 在 相同 固定 时 间 量 A 区 间 播 放 的 视频 帧 。 服 务 器 在 传输 第 一 个 视频 
Hk, HE to +A 传输 第 二 个 视频 块 ， 在 i。+2A 传输 第 三 个 视频 块 等 等 。 一 旦 客户 开始 播放 ， 
-为 了 重新 产生 初始 录制 视频 的 定时 ， 每 个 块 应 当 在 前 一 个 块 之 后 播放 A 时 间 单 元 。 第 一 个 
视频 块 于 4 时 刻 到 达 ， 第 二 个 视频 块 于 t, 时 刻 到 达 。 第 ; 块 的 网 络 时 延 是 服务 器 传输 该 块 






客户 端的 固定 
比特 率 视频 播放 


视频 块 编号 


t+ å +A +A 


图 9-1 视频 流 中 的 客户 播放 时 延 


的 时 间 与 客户 收 到 该 块 的 时 间 之 间 的 水 平 距离 ; 注意 到 网 络 时 延 随 视频 块 不 同 而 变化 。 在 
此 例子 中 ， 如 果 客 户 准备 当 第 一 块 在 4 时 刻 一 到 达 就 开始 播放 ， 那 么 第 二 块 将 不 能 在 
ti + 人 A 时 刻 及 时 到 达 进 行 播放 。 在 这 种 情况 下 ， 视 频 播放 或 将 停止 运行 ( 等待 第 二 块 的 到 
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A) 或 可 能 漏 掉 第 二 块 ， 即 这 两 种 情况 都 将 导致 不 希望 的 播放 损伤 。 相 反 ， 如 果 客 户 将 播 
放 延 迟到 时 刻 开始 ， 这 时 第 一 块 到 第 六 块 都 已 经 到 达 ， 所 有 已 经 收 到 的 块 在 它们 的 播放 
时 间 前 都 能 够 进行 周期 性 的 播放 。 


9.2.1 UDP 流 


我 们 这 里 仅 简要 讨论 UDP 流 ， 在 适当 时 向 读者 更 为 深入 地 介绍 这 些 系 统 背 后 隐 含 的 
协议 。 使 用 UDP 流 ， 服 务 器 通过 UDP 以 一 种 稳定 的 速率 记录 下 视频 块 ， 用 与 客户 的 视频 
消耗 速率 相 匹 配 的 速率 传输 视频 。 例 如 ， 如 果 视 频 消耗 率 是 2Mbps， 每 个 UDP 分 组 承载 
8000 比特 视频 ， 则 服务 器 将 每 阳 (8000 比特 ) / (2Mbps) =4ms 向 其 套 接 字 发 送 一 个 
UDP 分 组 。 如 我 们 在 第 3 章 所 知 ， 因 为 UDP 未 采用 某 种 拥塞 控制 机 制 ， 所 以 服务 器 能 够 
以 视频 的 消耗 速率 将 分 组 推进 网 络 中 ， 而 无 TCP 的 速率 控制 的 限制 。UDP 流通 常 使 用 很 
小 的 客户 端 缓存 ， 空 间 维持 小 于 1 秒 视频 就 足够 了 。 

在 将 视频 块 传递 给 UDP 之 前 ， 服 务 器 将 视频 块 封装 在 运输 分 组 中 ， 该 运输 分 组 是 专 
门 为 传输 音频 和 视频 而 设计 的 ， 使 用 了 实时 传输 协议 (Real-Time Transport Protocol, RTP) 
[RFC 3550] 或 某 种 类 似 〈 可 能 是 专用 ) 的 方案 。 我 们 将 在 9. 3 节 再 讨论 RTP， 那 时 我 们 
将 在 会 话 式 语音 和 视频 系统 环境 中 讨论 RTP. 

UDP 流 的 另 一 种 不 同 的 性 质 是 ， 除 了 服务 器 到 客户 的 视频 流 外 ， 两 者 间 还 并 行 地 维护 
一 个 单独 的 控制 连接 ， 通 过 该 连接 ， 客 户 可 发 送 有 关 会 话 状态 变化 的 命令 〈 如 和 暂停、 重新 
开始 、 重 定位 等 ) 。 这 种 控制 连接 在 许多 方面 类 似 于 我 们 在 第 2 章 中 学 习 的 FTP 控制 连接 。 
在 本 书 配套 Web 网 站 上 更 为 详细 地 解释 了 实时 流 协 议 (Real-Time Streaming Protocol, 
RTSP) [RFC 2326]， 它 是 一 种 用 于 这 样 的 控制 连接 的 流行 开放 协议 。 

尽管 UDP 流 已 经 在 多 个 开源 系统 和 专用 产品 中 得 到 应 用 ， 但 它 有 三 个 重大 不 足 。 首 
先 ， 由 于 服务 器 和 控制 之 间 的 可 用 带宽 无 法 预测 并 且 是 变化 的 ， 恒 定 速 率 UDP 流 不 能 够 
提供 连续 的 播放 。 例 如 考虑 以 下 场景 : 视频 消耗 速率 为 1Mbps， 服 务 器 到 客户 可 用 带宽 通 
W Mbps, 但 每 过 几 分 钟 就 有 几 秒 时 间 其 可 用 带宽 低 于 1Mbps。 在 这 种 场景 下 ， 以 
1Mbps 恒定 速率 经 RTP/UDP 传输 视频 的 UDP 流 系统 很 可 能 将 提供 不 好 的 用 户 体 验 ， 在 可 
用 带宽 低 于 1Mbps 之 后 产生 停滞 或 漏 帧 。UDP 流 的 第 二 个 缺点 是 它 要 求 如 RTSP 服务 器 这 
样 的 媒体 控制 服务 器 ， 以 对 每 个 进行 中 的 客户 会 话 处 理 客户 到 服务 器 的 交互 请 求 和 跟踪 客 
户 状态 (例如 在 视频 中 的 客户 播放 点 ， 视 频 是 否 被 暂停 或 播放 等 )。 这 增加 了 部 署 大 规模 
的 按 需 视频 系统 的 总 体 成 本 和 复杂 性 。 第 三 个 缺点 是 许多 防火 墙 配置 为 阻塞 UDP 流量 ， 
防止 这 些 防 火 墙 后 面 的 用 户 接收 UDP 视频 。 


9.2.2 HTTP 流 


在 HTTP 流 中 ， 视 频 直 接 作 为 具有 一 个 特定 URL 的 普通 文件 存储 在 HTTP 服务 器 上 。 
当 用 户 要 看 视频 时 ， 客 户 和 服务 器 之 间 建 立 一 个 TCP 连接 ， 并且 发 送 一 个 对 该 URL 的 
HTTP GET 请 求 。 服 务 器 则 尽 可 能 快 地 在 HTTP 响应 报 文中 发 送 该 视频 文件 ， 这 就 是 说 ， 
以 TCP 拥塞 控制 和 流 控制 允许 的 尽 可 能 快 的 速率 进行 处 理 。 在 客户 端 上 ， 字 节 收 集 在 一 个 
客户 应 用 缓存 中 。 一 且 在 缓存 中 字 节 数量 超过 了 预先 设 定 的 阀 值 ， 该 客户 应 用 程序 开始 播 
放 ， 具 体 而 言 ， 它 周期 性 地 从 客户 应 用 缓存 中 抓 取 视频 帧 ， 对 帧 解压 缩 并 在 用 户 屏幕 上 显 
示 它 们 。 

我 们 在 第 3 章 学 习 过 ， 当 通过 TCP 传输 一 个 文件 时 ， 由 于 TCP 的 拥塞 控制 机 制 ， 服 
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务 器 到 客户 的 传输 速率 可 能 变化 很 大 。 特 别 是 ， 传 输 速率 以 与 TCP 拥塞 控制 相关 联 的 
“锯齿 ”形变 化 并 非 罕 见 。 此 外 ， 分 组 也 能 由 于 重 传 机 制 而 被 大 大 延迟 。 因 为 TCP 的 这 
些 特点 ,在 20 世纪 90 年 代 大 多 数 人 关于 会 话 式 的 看 法 是 流 式 视 频 将 不 可 能 在 TCP 上 很 
好 地 工作 。 然 而 ， 随 着 时 间 的 推移 ， 流 式 视 频 系统 的 设计 者 知道 了 当 使 用 了 客户 缓存 和 
预 取 (在 下 面 讨 论 ) 技术 时 ，TCP 的 拥塞 控制 和 可 靠 数据 传输 机 制 并 不 一 定 会 妨碍 连续 
播放 。 

在 TCP 上 使 用 HTTP 也 使 得 视频 穿越 防火 墙 和 NAT (它们 常常 被 配置 为 阻挡 UDP 流 
量 但 允许 大 部 分 HTTP 流量 通过 ) 更 为 容易 。HTTP 流 消除 了 因 需 要 媒体 控制 服务 器 (如 
RTSP 服务 器 ) 带 来 的 不 便 , 减少 了 在 因特网 上 大 规模 部 署 的 成 本 。 由 于 所 有 这 些 优 点 ， 
今天 的 大 多 数 流 式 视频 应 用 (包括 YouTube 和 Netflix) 都 使 用 HTTP 流 (在 TCP 上 ) 作为 
它 的 底层 流 式 协议 。 

1. 预 取 视频 

如 同 我 们 刚才 所 学 的 那样 ， 客 户 端 缓存 可 用 于 缓解 变化 的 端 到 端 时 延 和 变化 的 可 用 带 
宽 的 影响 5 在 前 面 图 9-1 的 例子 中 ， 服 务 器 以 视频 播放 的 速率 传输 。 然 而 ， 对 于 流 式 存储 
视频 ， 客 户 能 够 尝试 以 高 于 消耗 速率 的 速率 下 载 视频 ， 因 此 预 取 (prefetching) 将 来 会 被 
消耗 的 视频 帧 。 该 预 取 的 视频 当然 存储 在 客户 应 用 缓存 中 。 这 样 的 预 取 自 然 伴随 TCP 流出 
现 ， 因 为 TCP 拥塞 避免 机 制 将 试图 使 用 服务 器 和 客户 之 间 的 所 有 可 用 带宽 。 

为 了 深入 洞察 预 取 技术 ， 我 们 来 举 个 简单 的 例子 。 假 设 视 频 消 耗 速率 是 1Mbps， 而 网 
络 从 服务 器 到 客户 能 够 以 恒定 的 1. 5Mbps 速率 交付 视频 。 客 户 则 不 仅 能 够 以 非常 小 的 播放 
时 延 播放 该 视频 ， 而 且 还 能 够 以 每 秒 500Kb 的 量 增加 缓存 的 视频 数据 。 以 这 种 方式 ， 如 果 
后 来 该 客户 在 一 段 短暂 时 间 内 以 小 于 1Mbps 的 速率 接收 数据 ， 该 客户 由 于 在 其 缓存 中 的 储 
备 将 能 够 继续 提供 连续 的 播放 。[ Wang 2008] 显示 了 当 平 均 TCP 吞吐 量 大 致 为 媒体 比特 
率 的 两 倍 时 ，TCP 流 导 臻 最 小 的 饥 俄 和 低 缓存 时 延 。 

2. 客户 应 用 缓存 和 TCP 缓存 


图 9-2 说 明了 客户 和 服务 器 之 间 HTTP 流 的 交互 。 在 服务 器 侧 ， 视 频 文件 中 的 白色 部 
分 已 经 通过 服务 器 的 套 接 字 进行 发 送 ， 而 黑色 部 分 是 留 下 待 发 送 的 部 分 。 在 “通过 套 接 字 
的 门 传送 ”之 后 ， 放 置 在 TCP 发 送 缓存 中 的 字 节 在 被 传输 进 因特网 之 前 如 第 3 章 所 描述 。 
在 图 9-2 中 ， 因 为 TCO 发 送 缓存 显示 为 满 ， 服 务 器 立即 防止 从 视频 文件 向 套 接 字 发 送 更 多 
的 字 节 。 在 客户 侧 ， 客 户 应 用 程序 (媒体 播放 器 ) 从 TCP 接收 缓存 (通过 其 客户 套 接 字 ) 
读 出 字 节 并 将 字 节 放 和 人 客户 应 用 缓存 中 。 与 此 同时 ， 客 户 应 用 程序 周期 性 地 从 客户 应 用 组 
存 中 抓 取 视频 帧 ， 解 压缩 并 显示 在 用 户 屏幕 上 。 注 意 到 如 果 客 户 应 用 缓存 大 于 该 视频 文 
件 ， 则 从 服务 器 存储 器 到 客户 应 用 缓存 移动 字 节 的 整个 过 程 等 价 于 普通 文件 经 HTTP 的 下 
载 过 程 ， 即 客户 直接 将 视频 用 TCP 允许 的 尽 可 能 快 的 速率 从 服务 器 中 拉 出 来 。 

现在 考虑 在 流 播放 期 间 当 用 户 暂 停 视频 时 将 发 生 的 现象 。 在 暂停 期 间 ， 比 特 未 从 客户 
应 用 缓存 中 删除 ， 其 至 比特 继续 从 服务 器 进入 缓存 。 如 果 客户 应 用 缓存 是 有 限 的 ， 它 可 能 
最 终 会 变 满 ， 这 将 反 过 来 引起 对 服务 器 的 “ 反 向 压力 ”。 具 体 而 言 ， 一 旦 客户 应 用 缓存 变 
满 ， 字 节 不 再 从 客户 TCP 接收 缓存 中 删除 ， 因 此 它 也 会 变 满 。 一 旦 客户 TCP 接收 缓存 变 
满 ， 字 节 不 再 从 服务 器 TCP 发 送 缓 存 删 除 ， 因 此 它 也 变 满 。 一 旦 客户 TCP 发 送 缓存 变 满 ， 
服务 器 不 能 向 套 接 字 中 发 送 任何 更 多 的 字 节 。 因 此 ， 如 果 用 户 暂 停 视频 ， 服 务 器 可 能 被 迫 
停止 传输 ， 在 这 种 情况 下 服务 器 被 阻塞 ， 直 到 用 户 恢复 该 视频 。 
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图 9-2 经 HTTP/TCP 的 流 式 存储 视频 


事实 上 ， 甚 至 在 常规 的 播放 过 程 中 〈 即 没有 暂停 ) ， 如 果 客 户 应 用 缓存 变 满 ， 反 向 压 
力 将 引起 TCP 缓存 变 满 ， 这 将 迫使 服务 器 降低 其 速率 。 为 了 决定 其 产生 的 速率 ， 注 意 到 当 
客户 缓存 删除 /比特 ， 它 在 客户 应 用 缓存 中 产生 了 j 比特 的 空间 ， 这 依次 允许 服务 器 发 送 


额外 的 了 比特 。 因 此， 服务 器 发 送 速率 不 能 比 客户 端 视频 消耗 速率 更 高 。 因 此 ， 当 使 用 


HTTP 流 时 ， 一 个 满 的 客户 应 用 缓存 间接 地 对 服务 器 到 客户 能 够 发 送 的 视频 速率 施加 了 
限制 。 

3. 流 式 视频 的 分 析 

某 些 简单 的 建 模 将 有 助 于 洞察 由 于 应 用 缓存 消耗 所 产生 的 初始 播放 时 延 和 停滞 。 如 
图 9-3 所 示 ，B 表示 客户 应 用 缓存 的 长 度 【( 以 比特 计 ) ，Q 表示 在 客户 应 用 缓存 开始 播放 之 
前 必须 被 缓存 的 比特 数量 。( 当然 ，0 < B。) r 表示 视频 消耗 速率 ， 即 客户 在 播放 期 间 从 客 
户 应 用 缓存 提取 比特 的 速率 。 在 此 情况 下 ， 举 例 来 说 ， 如 果 视 频 的 帧 速率 是 30 帧 / 秒 ， 每 
(压缩 ) 帧 是 100 000 比特 ， 则 r=3Mbps。 为 了 从 细节 看 整体 ， 我 们 将 忽略 TCP 的 发 送 和 
接收 缓存 。 


消耗 速率 =7 
—,- 





图 9-3 流 式 视频 的 客户 端 缓 存 的 分 析 


我 们 假设 无 论 何 时 客户 缓存 都 为 非 空 ， 服 务 器 以 一 种 恒定 速率 x 发 送 比 特 。( 这 是 一 
种 显而易见 的 简化 ， 因 为 TCP 的 发 送 速 率 由 于 拥塞 控制 而 变化 ; 在 本 章 后 面 的 习题 中 我 们 
将 考察 更 为 真实 的 与 时 间 相 关 的 速率 x(1)。) 假设 在 时 刻 上 =0， 应 用 缓存 为 空 ， 视 频 开 始 
到 达 客 户 应 用 缓存 。 我 们 现在 问 ， 在 什么 时 刻 t=t, 开始 播放 呢 ? 并 且 在 播放 过 程 中 ， 什 
AETA t =t; 客户 应 用 缓存 变 满 呢 ? 
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首先 ， 我们 来 确定 i,， 此 时 O 比特 已 经 进入 应 用 缓存 并 且 开始 播放 。 前 面 讲 过 比特 以 
速率 x 到 达 客 户 应 用 缓存 ， 并 且 在 开始 播放 之 前 没有 比特 从 其 缓存 中 删除 。 所 以 ， 建 立 0 
比特 所 需 的 时 间 (初始 缓存 时 延 ) Æ t, = Q/x。 

我 们 现在 来 决定 i， 这 是 客户 应 用 缓存 变 满 的 时 刻 。 我 们 先 观察 ， 如 果 x <r ( 即 如 果 
服务 器 发 送 速率 小 于 视频 消耗 速率 ) ， 则 客户 缓存 将 决 不 会 满 ! 的 确 ， 时 刻 开始， 缓存 
将 以 速率 > 排 空 并 且 仅 以 速率 * <r 填 充 。 最 终 客 户 缓存 将 完全 排 空 ， 此 时 当 客 户 缓存 等 待 
男 一 个 秒 来 建 起 0 比特 的 视频 时 ， 视 频 将 在 屏幕 上 停滞。 所 以 ， 当 网 络 中 可 用 速率 小 
于 视频 速率 时 ， 播 放 将 在 连续 播放 期 和 停滞 播放 期 之 间 进 行 变 动 。 在 课 后 习题 中 ， 将 请 你 
决定 每 个 连续 播放 期 和 停滞 期 的 长 度 ， 它 们 都 作为 0、r 和 的 函数 。 当 x >r 时， 现在 我 
们 来 决定 tj。 在 这 种 情况 下 ， 在 时 刻 i 开始， 缓存 以 x -7 的 速率 从 0 增加 到 B， 因 为 比特 
以 速率 7 消耗 但 以 速率 x 到 达 ， 如 图 9-3 所 示 。 有 了 这 些 提示 ， 在 课 后 习题 中 将 请 你 决定 
t:， 即 客户 缓存 变 满 的 时 刻 。 注 意 到 当 网 络 中 的 可 用 速率 大 于 视频 过 率 时 ， 在 初始 缓存 时 
延 后 ， 用 户 将 享受 连续 的 播放 直到 视频 结束 。 

4. 视频 的 早期 中 止 和 重 定位 

HTTP 流 系统 经 常 利用 HTTP GET 请 求 报 文 中 的 HTTP 字 节 范围 首部 (HTTP byte- 
range header) ， 该 首部 指示 了 客户 当前 要 从 所 希望 的 视频 中 获取 的 字 节 范围 。 当 用 户 要 在 
视频 中 及 时 重 定位 ( 即 跳跃 ) 到 未 来 点 时 ， 这 特别 有 用 。 当 用 户 重 定位 到 一 个 新 位 置 时 ， 
客户 发 送 一 个 新 HTTP 请 求 ， 用 字 节 范围 首部 指出 服务 器 应 当 从 文件 的 哪个 字 节 起 发 送 数 
据 。 当 服务 器 接收 到 该 新 的 HTTP 请 求 时 ， 它 能 够 忘记 任何 较 早 的 请 求 ， 而 是 由 字 节 范围 
请 求 中 指示 的 字 节 开始 发 送 。 

在 我 们 讨论 重 定 位 主题 的 时 候 ， 我 们 简要 地 提 及 当 某 用 户 重 定位 到 视频 中 的 某 个 未 来 
点 或 提前 终止 视频 时 ， 某 些 由 服务 器 发 送 的 已 预 取 但 尚未 观看 的 数据 将 不 会 被 观看 ， 即 导 
致 了 网 络 带宽 和 服务 器 资源 的 浪费 。 例 如 ， 假 设 在 视频 中 的 某 时 刻 i 客户 缓存 充满 B 比 
特 ， 在 此 时 用 户 重 定位 到 视频 中 的 某 个 瞬间 上 > to + Br， 然 后 从 这 点 起 观察 视频 直到 结束 。 
在 这 种 情况 下 ， 缓存 中 的 所 有 B 比特 将 未 被 观看 ， 用 于 传输 这 B 比特 的 带宽 和 服务 器 资源 
完全 被 浪费 掉 了 。 在 因特网 中 ， 有 大 量 的 带宽 因 提 前 终止 而 浪费 ， 这 些 成 本 可 能 相当 大 ， 
特别 是 对 于 无 线 链 路 [Thm 2011 ] 。 由 于 这 个 原因 ， 许 多 流 系统 仅 使 用 了 长 度 适当 的 客户 
应 用 缓存 ， 或 者 将 限制 在 HTTP 请 求 中 使 用 字 节 范围 首部 预 取 的 视频 数量 [Rao 2011 ] 。 

重 定位 和 提前 终止 可 以 与 下 列 做 法 类 比 : 训 调 了 很 多 肉 ， 仅 吃 了 一 部 分 ， 并 将 其 他 都 
扔 掉 ， 因 而 浪费 了 食物 。 因 此 ， 下 次 你 因为 没有 吃 完 所 有 晚餐 而 被 父母 批评 浪费 食物 时 ， 
你 能 够 迅速 反驳 : 当 他 们 在 因特网 上 观看 电影 并 进行 带宽 重 定位 时 ， 他 们 浪费 了 带宽 和 服 
务 器 资源 ! 但 是 ， 别 人 错 了 不 等 于 你 对 了 ， 食 物 和 带宽 都 不 应 被 浪费 ! 

在 9.2.1 节 和 9.2.2 节 中 ,我 们 分 别 学 习 了 UDP 流 和 HTTP 流 。 第 三 种 流 是 经 HTTP 
的 动态 适应 流 (DASH), DASH 使 用 了 该 视频 的 多 个 版 本 ， 每 个 版 本 是 以 不 同 速率 压缩 而 
成 的 。DASH 在 2. 6. 2 节 中 进行 了 详细 讨论 。 分 发 存储 和 实况 视频 经 常 使 用 CDN。CDN 在 
2.6.3 节 中 进行 了 详细 讨论 。 


9.3 IPF 


经 因特网 的 实时 会 话 式 语 音 经 常 被 称 为 因特网 电话 ( Intemet telephony), AA MAIR 
的 视角 看 ， 它 类 似 于 传统 的 电路 交换 电话 服务 。 它 通常 也 被 称 为 IP 语音 (Voice-over-IP, 
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VoIP) 。 在 本 节 中 我 们 描述 VoIP 所 依据 的 原则 和 协议 。 会 话 式 视频 在 许多 方面 类 似 于 
VoIP， 除 了 它 包 括 参 与 者 的 视频 以 及 他 们 的 语音 以 外 。 为 了 使 讨论 重点 突出 且 具 体 ， 我 们 
这 里 仅 关 注 语音 ， 而 不 是 语音 和 视频 的 结合 。 


9.3.1 尽力 而 为 服务 的 限制 


因特网 的 网 络 层 协议 IP 提供 了 尽力 而 为 的 服务 。 那 就 是 说 服务 尽 全 力 将 每 个 数据 报 
从 源 尽 可 能 快 地 移动 到 目的 地 ， 但 是 没有 就 在 某 些 时 延 界限 内 使 分 组 到 达 目 的 地 或 竺 包 百 
分 比 的 限制 做 任何 承诺 。 缺 失 这 种 保证 对 实时 会 话 式 应 用 的 设计 提出 了 严峻 挑战 ， 这 些 应 
用 对 分 组 时 延 、 时 延 拌 动 和 丢 包 非常 敏感 。 

在 本 节 中 ， 我们 将 讨论 加 强 尽力 而 为 网 络 上 的 VolP 性 能 的 几 种 方式 。 我 们 的 重点 将 
在 应 用 层 技术 上 ， 即 这 些 技术 并 不 要 求 在 网 络 核心 甚至 在 端 系 统 的 运输 层 有 任何 变化 。 为 
了 使 讨论 具体 ， 我 们 将 讨论 在 一 个 特定 的 VoIP 例子 环境 下 尽力 而 为 IP 服务 的 限制 。 发 送 
方 以 每 秒 8000 字 节 的 速率 产生 字 节 ， 且 每 20ms 将 字 节 汇聚 成 块 。 每 个 块 和 一 个 特殊 的 首 
部 〈 在 下 面 讨论 ) 封装 在 一 个 UDP 报 文 段 中 〈 通 过 一 个 到 套 接 字 接 口 的 呼叫 ) 。 因 此 , 一 
个 块 中 的 字 节 数 为 (20ms) x (8000 字 节 / 秒 ) = 160 字 节 ， 每 20ms 发 送 一 个 UDP 报 文 段 。 

如 果 每 个 分 组 以 恒定 的 端 到 端 时 延 到 达 接 收 方 ， 那 么 分 组 每 隔 20ms 就 能 周期 性 地 到 
达 接 收 方 。 在 这 种 理想 的 情况 下 ， 只 要 每 个 块 一 到 达 ， 接 收 方 就 能 直接 播放 它 。 但 不 幸 的 
是 ， 某 些 分 组 可 能 丢失 ， 大 多 数 分 组 没有 相同 的 端 到 端 时 延 ， 即 使 在 一 个 轻 度 拥 塞 的 因 特 
网 中 也 是 如 此 。 因 此 ， 接 收 方 必 须 更 仔细 地 判断 : 中 什么 时 候 播放 一 个 块 ; 四 如 何 处 理 一 
个 丢失 块 。 

1. Ey 


考虑 由 VoIP 应 用 产生 的 一 个 UDP 报 文 段 。 这 个 UDP 报 文 段 封装 在 IP 数据 报 中 。 当 
数据 报 在 网 络 中 徘徊 时 ， 在 它 等 待 出 链 路 传输 时 要 经 过 路 由 器 的 缓存 〈 即 队列 ) 。 从 发 送 
方 到 接收 方 的 路 径 上 的 一 个 或 多 个 缓存 有 可 能 是 满 的 ， 不 能 接纳 该 卫 数据 报 。 在 这 种 情 
况 下 ， 这 个 他 数据 报 就 被 丢弃 了 ， 永 远 不 会 到 达 接 收 方 的 应 用 程序 。 

通过 TCP ( 它 提供 了 可 靠 数 据 传 输 ) 而 不 是 UDP 发 送 分 组 可 以 消除 丢失 。 然 而 ， 重 
传 机 制 对 于 诸如 VoIP 这 样 的 会 话 式 实时 音频 应 用 ， 通常 认为 是 不 可 接受 的 ， 因 为 它们 增 
加 了 端 到 端 时 延 [Bolot 1996 ] 。 此 外 ， 当 丢 包 后 ， 由 于 TCP 的 拥塞 控制 ， 发 送 方 的 传输 速 
率 可 能 减少 到 低 于 接收 方 的 排 空 速率 ， 可 能 导致 缓存 “饥饿 ”。 这 可 能 会 对 接收 方 的 语音 
可 理解 程度 产生 严重 影响 。 由 于 这 些 原因 ， 几 乎 所 有 现 有 的 VoIP 应 用 默认 运行 在 UDP 
上 。[ Baset 2006] 报告 称 Skype 使 用 了 UDP， 除 非 用户 位 于 阻碍 UDP 报 文 段 的 NAT 或 防 
火 墙 之 后 〈 这 时 使 用 TCP) 。 

但 是 分 组 的 丢失 并 不 一 定 会 造成 人 们 想象 中 的 灾难 。 实 际 上 ， 取 决 于 语音 是 如 何 编码 
和 传输 的 以 及 接收 方 隐 藏 丢 包 的 方式 ，1% ~20% 的 丢 包 率 是 可 以 忍受 的 。 例如， 前 向 纠 
错 (FEC) 能 够 有 助 于 隐藏 丢 包 。 我 们 后 面 可 以 看 到 ， 通 过 使 用 FEC， 将 元 余 信息 和 初始 
信息 一 起 传输 ， 以 便 能 够 从 完 余 信息 中 恢复 一 些 丢失 的 初始 数据 。 无 论 如 何 ， 如 果 发 送 方 
和 接收 方 之 间 的 一 段 或 多 段 链 路 严重 拥塞 ， 丢 包 率 超过 10% ~20% (例如 在 无 线 链 路 
上 ) ， 那 么 无 论 采 取 何 种 措施 都 无 法 获得 可 以 接受 的 声音 质量 了 。 显 然 ， 尽 力 而 为 服务 有 
它 的 局 限 性 。 

2. 端 到 端 时 延 


端 到 端 时 延 (end-to-end delay) 是 以 下 因素 的 总 和 : 路 由 器 中 的 传输 、 处 理 和 排队 时 
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延 ， 链 路 中 的 传播 时 延 和 端 系统 的 处 理 时 延 。 对 于 实时 会 话 式 应 用 ， 例 如 VolP， 听 电话 的 
人 对 于 小 于 150ms 的 端 到 端 时 延 是 觉察 不 到 的 ; 在 150ms 和 400ms 之 间 的 时 延 能 够 接受 ， 
但 是 不 够 理想 ; 超过 400ms 的 时 延 可 能 严重 妨碍 语音 谈话 的 交互 性 。VolP 应 用 程序 的 接 
收 方 通常 忽略 时 延 超过 特定 阅 值 (例如 超过 400ms) 的 任何 分 组 。 因 此 ， 时 延 超过 该 阅 值 
的 分 组 等 效 于 丢弃 。 

3. 分 组 时 延 抖动 


端 到 端 时 延 的 一 个 关键 成 分 是 一 个 分 组 在 网 络 路 由 器 中 经 历 的 变化 的 排队 时 延 。 由 于 
这 些 可 变 的 时 延 ， 从 在 源 中 产生 分 组 到 它 在 接收 方 收 到 的 这 段 时 间 ， 对 于 不 同 的 分 组 可 能 
会 有 波动 ， 如 图 9-1 所 示 。 这 个 现象 称 为 时 延 拌 动 (jitter)。 举 一 个 例子 ， 考 虑 在 VoIP 应 
用 中 两 个 连续 的 分 组 。 发 送 方 在 发 送 第 一 个 分 组 20ms 之 后 发 送 第 二 个 分 组 。 但 是 在 接收 
方 ， 这 两 个 分 组 之 间 的 间隔 可 能 变 得 大 于 20ms。 为 了 理解 这 一 点 ,假设 第 一 个 分 组 到 达 
路 由 器 的 一 个 几乎 为 空 的 队列 ,但 是 恰好 在 第 二 个 分 组 到 达 该 队列 之 前 ， 从 其 他 源 来 的 大 
量 分 组 也 到 达 了 相同 的 队列 。 因 为 在 这 个 路 由 器 中 第 一 个 分 组 经 受 了 很 小 的 排队 时 延 ， 而 
第 二 个 分 组 经 受 了 较 大 的 排队 时 延 ， 这 两 个 连续 的 分 组 之 间 的 时 间 间 隔 变 得 大 于 20ms 了 。 
两 个 连续 分 组 的 间隔 也 可 能 会 小 于 20ms。 为 了 理解 这 种 情况 ， 再 次 考虑 两 个 连续 的 分 组 。 
假设 第 一 个 分 组 加 入 一 个 有 大 量 分 组 队列 的 队 尾 ， 并 且 第 二 个 分 组 到 达 这 个 队列 时 第 一 个 
分 组 尚未 被 传输 ， 而 且 来 自 其 他 源 的 分 组 尚未 到 达 该 队列 。 在 这 种 情况 下 ， 这 两 个 分 组 发 
现 它们 在 队列 中 互相 紧 挨 着 。 如 果 在 路 由 器 的 出 链 路 传输 一 个 分 组 所 需 时 间 小 于 20ms， 
则 第 一 个 分 组 和 第 二 个 分 组 的 间隔 就 变 得 小 于 20ms T 。 

这 种 情况 可 以 与 在 公路 上 开车 相 类 比 。 假 设 你 和 你 的 朋友 每 人 驾驶 一 辆 车 从 美国 的 圣 
地 亚 哥 到 凤凰 城 。 并 且 假 设 你 和 朋友 有 类 似 的 驾驶 风格 ,而 且 你 们 都 以 交通 规则 允许 的 
100km/h 的 速度 驾驶 。 如 果 你 的 朋友 在 你 之 前 一 个 小 时 出 发 ,那么 根据 干扰 车 流量 的 不 
同 ， 你 可 能 在 你 的 朋友 之 后 一 个 小 时 左右 到 达 凤 凰 城 。 

如 果 接 收 方 忽 略 了 时 延 拌 动 的 存在 ,一 旦 该 块 到 达 就 开始 播放 ， 那 么 在 接收 方 产生 的 
”音频 质量 很 容易 变 得 不 可 理解 。 幸 运 的 是 ， 时 延 拌 动 通常 可 以 通过 使 用 序号 (sequence 
number), Ria #% (timestamp) 和 播放 时 延 (playout delay) 来 消除 ， 如 下 面 所 讨论 的 
内 容 。 


9.3.2 在 接收 方 消除 音频 的 时 延 抖动 


对 于 VoIP 应 用 ， 周 期 性 地 产生 分 组 ， 接 收 方 应 该 在 存在 随机 网 络 时 延 拌 动 的 情况 下 
尝试 提供 播放 语音 块 。 这 经 常 通过 结合 下 面 两 种 机 制 来 实现 : 
© 为 每 个 块 预先 计划 一 个 时 间 改 (timestamp)。 发 送 方 用 每 个 块 产生 的 时 刻 为 它 加 上 
时 间 印 记 。 
© 在 接收 方 延迟 播放 (delaying playout) 块 。 如 我 们 前 面 在 图 9-1 的 讨论 所 见 ， 接 收 
的 音频 块 的 播放 时 延 必须 足够 长 ， 以 便 大 多 数 分 组 在 它们 的 预定 播放 时 间 之 前 被 
接收 到 。 这 个 播放 时 延 可 能 在 整个 音频 会 话 期 间 是 固定 的 ,或 者 在 音频 会 话 生命 
期 中 适应 性 地 变化 。 
我 们 现在 讨论 如 何 结合 这 三 种 机 制 来 减轻 甚至 消除 时 延 拌 动 的 影响 。 我 们 研究 两 种 播 
放 策 略 : 固定 播放 时 延 和 适应 性 播放 时 延 。 
1. 固定 播放 时 延 
使 用 固定 播放 时 延 策略 ， 接 收 方 试图 在 块 产 生 正好 9 ms 后 播放 它 。 因 此 如 果 一 个 块 
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在 时 刻 上 打上 时 间 惟 ， 接 收 方 在 时 刻 上 +9 播放 这 个 块 ， 假 设 这 个 块 在 那个 时 间 已 经 到 达 。 
在 预定 播放 时 间 之 后 到 达 的 分 组 将 被 丢弃 ， 并 被 认为 已 经 丢失 。 

4 选择 什么 值 为 好 呢 ? 尽管 使 用 更 小 的 9 值 可 以 获得 更 令 人 满意 的 会 话 体验 ,但 VoIP 
能 够 支持 高 达 约 400ms 的 时 延 。 另 一 方面 ， 如 果 9 比 400ms 小 得 多 ， 那 么 由 于 网 络 引 入 的 
分 组 时 延 抖动 会 使 许多 分 组 可 能 错过 了 它们 的 预定 播放 时 间 。 概 括 地 说 ， 如 果 端 到 端 时 延 
经 常 发 生 大 的 变化 ， 用 一 个 大 的 q 更 好 ; 另 一 方面 ， 如 果 时 延 很 小 并 且 时 延 变化 也 很 小 ， 
用 一 个 较 小 的 、 可 能 小 于 150ms 的 g 更 好 。 

在 图 9-4 中 说 明了 播放 时 延 和 丢 
包 之 间 的 折 中 。 该 图 表示 了 单个 话音 
突 峰 期 的 分 组 产生 和 播放 的 时 间 。 考 
虑 了 两 种 不 同 的 初始 播放 时 延 。 如 最 
左边 的 阶梯 所 示 ， 发 送 方 以 规则 的 间 
隔 〈 比方 说 每 20ms) 产生 一 组 分 组 。 
在 这 个 话音 突 峰 期 中 的 第 一 个 分 组 在 
时 刻 r 被 接收 到 。 如 该 图 所 示 ， 由 于 
网 络 时 延 拌 动 ， 后 续 分 组 的 到 达 间 隔 
是 不 均匀 的 。 时 间 

对 于 第 一 个 播放 调度 时 间 ， 固 定 
的 初始 播放 时 延 设置 为 p -re 使 用 这 
个 方案 ,第 四 个 分 组 没有 在 它 调度 的 播放 时 间 到 达 ， 接 收 方 认 为 它 丢 失 了 。 对 于 第 二 个 调 
度 时 间 ， 固 定 的 初始 播放 时 延 设 置 为 p' - r。 对 于 这 个 方案 ， 所 有 分 组 都 在 它们 调度 的 播 
放 时 间 之 前 到 达 ， 因 此 没有 丢失 。 

2. 适应 性 播放 时 延 

上 面 的 例子 显示 了 当 使 用 固定 播放 时 延 来 设计 播放 策略 时 所 引起 的 重要 的 时 延 与 丢 包 
折 中 。 若 初始 播放 时 延 设 置 得 比较 大 ， 大 多 数 分 组 能 在 它们 的 截止 时 间 内 到 达 ， 因 此 存在 
的 丢失 将 可 忽略 不 计 ; 然而 ， 对 于 如 VoIP 这 样 的 会 话 式 服务 ， 长 时 延 即 使 不 是 不 能 忍受 
的 ， 至 少 也 是 令 人 厌恶 的 。 在 理想 情况 下 ， 我 们 希望 播放 时 延 最 小 化 ， 使 丢 包 低 于 一 定 百 
分 比 的 限制 。 

处 理 这 种 折 中 的 自然 方法 是 估计 网 络 时 延 和 网 络 时 延 变化 ， 并 且 在 每 个 话音 突 峰 期 的 
开始 相应 地 调整 播放 时 延 。 在 话音 突 峰 期 开始 时 适应 性 地 调整 播放 时 延 将 导致 发 送 方 静默 
期 的 压缩 和 拉 长 ; 然而， 静默 期 的 少量 压缩 和 拉 长 在 谈话 中 是 不 易 觉察 的 。 

根据 [Ramjee 1994 ] ， 我 们 现在 描述 一 种 接收 方 可 以 用 于 适应 性 地 调整 它 的 播放 时 延 
的 通用 算法 。 为 此 , $ 

t= 第 i 个 分 组 的 时 间 稚 = 该 分 组 在 发 送 方 产生 的 时 间 
ri = 分 组 i 被 接收 方 接收 的 时 间 
pi = 分 组 i 在 接收 方 播放 的 时 间 

第 i 个 分 组 的 端 到 端 网 络 时 延 是 7; -t;。 由 于 网 络 时 延 拌 动 ， 这 个 时 延 在 不 同 的 分 组 之 
间 会 发 生变 化 。 令 d; 表示 接收 到 第 i 个 分 组 时 的 平均 网 络 时 延 的 估计 值 。 这 个 估计 值 根据 
如 下 的 时 间 惟 来 构造 : 





图 9-4 不 同 的 固定 播放 时 延 情况 下 的 丢 包 


d; = (1 -u)d;, + u(r; — t;) 
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r -t 的 一 个 平滑 均值 。 这 个 估计 值 为 最 近 观 察 到 的 网 络 时 延 设置 了 比 过 去 一 段 时 间 观 察 到 
的 网 络 时 延 有 更 大 的 权重 。 这 种 估 值 的 形式 不 应 该 是 完全 陌生 的 ; 相似 的 思想 在 第 3 章 讨 
论 估计 TCP 往返 时 间 时 就 使 用 过 。 令 w 表示 与 估计 平均 时 延 的 平均 时 延 绝 对 偏差 的 估计 
值 。 这 个 估计 值 也 可 从 这 些 时间 惟 构建 : 
v; = (1 -u)v tulr, - t; -d, | 

为 每 个 接收 的 分 组 计算 估计 值 d; Alo; ， 尽 管 它们 仅 能 用 于 为 任何 话音 突 峰 期 的 第 一 个 
分 组 确定 播放 点 。 

一 旦 计算 完了 这 些 估计 值 ， 接 收 方 为 分 组 播放 应 用 下 列 的 算法 。 如 果 分 组 i 是 一 个 话 
音 突 峰 期 的 第 一 个 分 组 ， 它 的 播放 时 间 pi 计算 如 下 : 

P: = t; + d; + Kv; 
这 里 天 是 一 个 正 的 常数 (PK =4), Koy, WA E HEA KR E E A h AT E , 
以 便 话音 突 峰 期 中 只 有 一 小 部 分 到 达 的 分 组 由 于 迟到 而 丢失 。 在 一 个 话音 突 峰 期 中 任何 
后 续 分 组 的 播放 点 被 计算 为 对 于 这 个 话音 突 峰 期 的 第 一 个 分 组 播放 时 间 点 的 偏 移 。 特 别 
je, > 
Gi = Pi — 4; 
表示 从 话音 突 峰 期 的 第 一 个 分 组 产生 到 它 播放 的 时 间 长 度 。 如 果 分 组 j 也 属于 这 个 话音 突 
峰 期 ， 它 播放 的 时 刻 是 
Pp; = +O 

刚才 描述 的 算法 在 假设 接收 方 能 够 辨 明 一 个 分 组 是 否 是 话音 突 峰 期 中 的 第 一 个 分 组 的 

情况 下 很 有 意义 。 这 能 够 通过 检查 每 个 接收 到 的 分 组 中 的 信号 能 量 来 做 到 。 


9.3.3 ”从 丢 包 中 恢复 


我 们 已 经 较为 详细 地 讨论 了 一 个 VoIP 应 用 能 够 怎样 处 理 分 组 时 延 拌 动 。 我 们 现在 简 
要 地 描述 在 存在 丢 包 的 情况 下 几 种 试图 保护 可 接受 的 音频 质量 的 方案 。 这 样 的 方案 被 称 为 
丢 包 恢复 方案 (loss recovery scheme) 。 这 里 我 们 定义 了 广义 的 丢 包 : 如 果 某 分 组 不 能 到 达 
接收 方 或 者 在 它 调度 的 播放 时 间 之 后 才 到 达 ， 该 分 组 则 丢失 。 我 们 再 次 用 VoIP 例子 作为 
描述 丢 包 恢复 方案 的 环境 。 

如 在 本 节 开 始 提 到 的 那样 ， 在 诸如 VoIP 等 会 话 式 实时 应 用 中 ， 重 传 丢 失 的 分 组 通常 
是 不 可 行 的 。 的 确 ， 重 传 一 个 已 经 错过 了 播放 截止 时 间 的 分 组 是 绝对 没有 意义 的 。 而 且 重 
传 一 个 在 路 由 器 队列 溢出 的 分 组 通常 不 能 足够 快 地 完成 。 由 于 这 些 考虑 ，VoIP 应 用 通常 
使 用 某 种 类 型 的 丢 包 预期 方案 。 两 种 类 型 的 丢 包 预期 方案 是 前 向 纠 错 (Forward Error Cor- 
rection, FEC) 与 交织 (interleaving) 。 

1. 前 向 纠 错 


FEC 的 基本 思想 是 给 初始 的 分 组 流 增加 宛 余 信息 。 以 稍微 增加 传输 速率 为 代价 ， 这 些 
元 余 信 息 可 以 用 来 重建 一 些 丢 失 分 组 的 近似 或 者 准确 版 本 。 根 据 文献 [Bolot 1996] 和 
[Perkins 1998 ] ， 我 们 现在 概括 了 两 种 简单 的 FEC 机 制 。 第 一 种 机 制 是 每 发 送 n 个 块 之 后 
发 送 一 个 元 余 编 码 的 块 。 这 个 元 余 块 通过 异 或 n 个 初始 块 来 获得 【Shacham 1990]。 以 这 
种 方式 ， 在 这 n+1 个 分 组 的 组 中 ， 如 果 任 何 一 个 分 组 丢失 ， 接 收 方 能 够 完全 重建 丢失 的 
分 组 。 但 是 如 果 这 一 组 中 有 两 个 或 更 多 分 组 丢失 ， 接 收 方 则 无 法 重建 丢失 的 分 组 。 通 过 让 
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组 的 长 度 n+1 比较 小 ， 当 丢失 不 是 很 多 时 ， 大 部 分 丢失 分 组 都 可 以 恢复 。 然 而 组 的 长 度 
越 小 ， 相 对 增加 的 传输 速率 就 越 大 。 特 别 是 若 传输 速率 以 1/n 因子 增加 的 话 ， 例 如 n=3， 
则 传输 速率 增加 33% 。 此 外 ， 这 个 简单 的 方案 增加 了 播放 时 延 ， 因 为 接收 方 在 能 够 开始 播 
放 之 前 ， 必 须 等 待 收 到 整个 组 的 分 组 。 有 关 FEC 在 多 媒体 传输 上 如 何 工作 的 更 多 实践 细节 
参见 [RFC 5109], 

第 二 个 FEC 机 制 是 发 送 一 个 较 低 分 辩 率 的 音频 流 作 为 元 余 信 息 。 例 如 ， 发 送 方 可 能 创 
建 一 个 标 称 的 音频 流 和 一 个 相应 的 低 分 辨 率 、 低 比特 率 的 音频 流 。 (这 个 标 称 流 可 能 是 一 
个 64kbps 的 PCM 编码 ， 而 这 个 较 低 质量 的 流 可 能 是 一 个 13kbps 的 GSM 编码 。) 这 个 低 比 
特 率 流 被 认为 是 元 余 信息 。 如 图 9-5 所 示 ， 发 送 方 通过 从 这 个 标 称 流 中 取出 第 个 块 并 附 
加 上 第 (n-1) 个 块 的 元 余 信 息 ， 以 构建 第 n 个 分 组 。 以 这 种 方式 ， 只 要 没有 连续 分 组 的 
丢失 ， 接 收 方 都 可 以 通过 播放 和 后 续 分 组 一 起 到 达 的 低 比 特 率 编码 块 来 隐藏 丢失 。 当 然 ， 
低 比 特 率 块 比 标 称 块 的 质量 要 低 。 然 而 ， 在 一 个 流 主要 是 由 高 质量 块 组 成 、 偶 尔 出 现 低 质 
量 块 并 且 没 有 丢失 的 块 的 情况 下 ， 其 整体 的 音频 质量 和 良好。 注意 到 在 这 种 方案 中 ， 接 收 方 
在 播放 前 只 需 接 收 两 个 分 组 ， 因 此 增加 的 时 延 小 。 此 外 ， 如 果 低 比特 率 编 码 比 标 称 编码 少 
得 多 ， 那 么 传输 速率 的 额外 增加 并 不 大 。 





图 9-5 FAAP RAY TCA a. 


为 了 处 理 连续 丢失 ， 我 们 能 够 使 用 率 一 个 简单 的 修正 方案 。 发 送 方 不 再 仅 为 第 n 个 标 
称 块 附加 上 第 (n -1) 个 低 比特 率 块 ， 而 是 附加 上 第 (n -1) 个 和 第 (n -2) 个 低 比特 
RHR, RAMME (n -1) 个 和 第 (n -3) 个 低 比 特 率 块 等 等 。 通 过 给 每 个 标 称 块 附加 
上 更 多 低 比特 率 块 ， 在 各 种 恶劣 的 尽力 而 为 服务 环境 下 接收 方 的 音频 质量 变 得 可 接受 。 在 
为 一 方面 ， 附 加 的 块 增加 了 传输 带宽 和 播放 时 延 。 

2. 交织 

作为 元 余 传 输 的 另 一 种 蔡 代 方案 ，VoIP 应 用 可 以 发 送 交 织 的 音频 。 如 图 9-6 所 示 ， 发 
送 方 在 传输 之 前 对 音频 数据 单元 重新 排序 ， 使 得 最 初 相 邻 的 单元 在 传输 流 中 以 一 定 距离 分 
离开 来 。 交 织 可 以 减轻 丢 包 的 影响 。 例 如 ， 如 果 每 个 单元 长 为 Sms， 块 是 20ms (也 就 是 每 
个 块 4 个 单元 ) ， 那 么 第 一 个 块 可 能 包含 1、5、9 和 13 单元 ; 第 二 个 块 可 能 包含 2、6、10 
和 14 单元 等 等 。 图 9-6 显示 了 一 个 交织 流 的 单个 丢 包 导致 重建 流 中 的 多 个 小 间隙 ， 这 与 
在 非 交 织 流 中 将 会 导致 单个 大 间 陈 形成 对 照 。 


SUK AA 453 








图 9-6 发送 交织 音频 


交织 能 够 明显 地 提高 音频 流 可 感觉 到 的 质量 [Perkins 1998 ] 。 它 的 开销 也 较 低 。 交 织 
明显 的 缺点 是 增加 了 时 延 。 这 限制 了 它 在 如 VoIP 这 样 的 会 话 式 应 用 中 的 使 用 ， 然 而 它 能 
够 很 好 地 处 理 流 式 存储 音频 。 交 织 的 一 个 主要 优点 是 它 不 增加 流 的 带宽 需求 。 

3. 差错 掩盖 


差错 掩盖 方案 试图 为 丢失 的 分 组 产生 一 个 与 初始 分 组 类 做 的 替代 物 。 正 如 在 [Perkins 
1998] 中 讨论 的 那样 ， 因 为 音频 信号 (特别 是 语音 ) 呈现 出 大 量 的 短期 自 相似 性 ， 故 该 
方案 是 可 行 的 。 正 因为 如 此 ， 这 些 技术 适合 于 工作 在 相对 小 的 丢 包 率 ( 低 于 15%) 和 小 
分 组 (4 ~40ms) 的 情况 。 当 丢失 长 度 接近 音素 的 长 度 (5 ~100ms) 时 ， 这些 技术 就 失效 
了 ， 因 为 整个 音素 可 能 被 听 者 错过 。 

也 许 基 于 接收 方 的 恢复 的 最 简单 方式 是 分 组 重复 。 即 用 在 丢失 之 前 刚 到 达 的 分 组 的 一 
本 来 代替 丢失 的 分 组 。 这 种 方法 的 计算 复杂 度 低 ， 并 且 工 作 得 相当 好 。 基 于 接收 方 恢复 的 
男 一 种 形式 是 内 插 法 ， 它 使 用 在 丢失 之 前 和 之 后 的 音频 内 插 形 成 一 个 合适 分 组 来 隐藏 丢 
失 。 内 插 法 比分 组 重复 稍微 好 一 些 , 但 是 显然 需要 更 高 的 计算 强度 [Perkins 1998 ] 。 


9.3.4 学 习 案例 : 使 用 Skype 的 VoIP 


Skype 是 一 个 非常 流行 的 VoIP 应 用 ， 每 天 都 有 超过 5000 万 个 活跃 的 账户 。Skype 除了 
提供 主机 到 主机 的 VoIP 服务 ,还 提供 主机 到 电话 的 服务 ， 电 话 到 主机 的 服务 ， 以 及 多 方 
主机 到 主机 的 视频 会 议 服务 。 (这 里 ， 主 机 仍然 是 任 一 种 因特网 连接 P 设备 ， 包 括 PC、 
平板 电脑 和 智能 手机 。) Skype 于 2011 年 被 微软 公司 收购 。 

因为 Skype 协议 是 专用 的 ， 并 且 因 为 所 有 Skype 的 控制 和 媒体 分 组 是 加 密 的 ， 所 以 精 
确 地 确定 Skype 的 工作 过 程 是 非常 困难 的 。 无 论 如 何 ， 从 Skype 的 Web 网 站 和 几 项 测量 研 
究 ， 研 究 人 员 已 经 知道 了 Skype 总 体 上 是 怎样 工作 的 [Baset 2006; Guha 2006; Chen 
2006; Suh 2006; Ren 2006; Zhang X 2012 ] 。 对 于 语音 和 视频 ，Skype 客户 都 有 许多 自行 
支配 的 不 同 编 解 码 器 ， 这 些 编 解 码 器 能 够 以 宽泛 的 速率 和 质量 对 媒体 进行 编码 。 例 如 ， 测 
量 表 明 Skype 的 视频 速率 从 用 于 低 质量 会 话 的 低 至 30kbps 到 用 于 高 质量 会 话 的 高 至 1Mbps 
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左右 [Zhang X 2012 ] 。 一 般 而 言 ，Skype 语音 质量 好 于 由 有 线 电话 系统 提供 的 “POTS 
(简单 老式 电话 服务 )” 的 质量 。( Skype 编 解码 器 通常 以 16 000 样本 / 秒 或 更 高 速率 对 语音 
抽样 ， 这 提供 比 POTS 更 为 丰富 的 音色 ，POTS 的 抽样 率 为 8000/ 秒 。) 在 默认 状态 下 ， 
Skype 通过 UDP 发 送 音频 和 视频 分 组 。 然 而 ， 控 制 分 组 经 TCP 发 送 ， 并 且 当 防火 墙 阻挡 
UDP 流 时 ， 媒 体 分 组 也 通过 TCP AIK, Skype 对 于 经 UDP 发 送 的 语音 和 视频 流 使 用 FEC 
处 理 丢 包 恢 复 。Skype 客户 还 通过 改变 视频 质量 和 FEC 开销， 使 它 所 发 送 的 音频 和 视频 流 
适应 当前 的 网 络 情况 [Zhang X 2012), 

Skype 以 一 些 创新 方式 使 用 P2P 技术 ,很 好 地 阐述 了 P2P 是 如 何 应 用 于 除 内 容 分 发 和 
文件 共享 之 外 的 应 用 中 的 。 如 同 即 时 讯息 那样 ， 主 机 到 主机 因特网 电话 应 用 的 核心 内 在 地 
应 用 了 P2P 技术 ， 因 为 用 户 对 〈 即 对 等 方 ) 彼此 实时 通信 。 但 是 Skype 也 对 两 个 其 他 重要 
功能 应 用 了 P2P 技术 ， 这 两 个 功能 是 用 户 定位 和 NAT 穿越 。 

如 图 9-7 所 示 ，Skype 中 的 对 等 方 (主机 ) 组 织 成 为 一 个 等 级 制 覆盖 网 络 ， 其 中 每 个 
对 等 方 分 类 为 超级 对 等 方 和 普通 对 等 方 。Skype 维护 一 个 索引 ， 该 索引 将 Skype 用 户 名 映 
射 为 当前 的 下 地 址 (和 端口 号 )。 该 索引 经 过 超级 对 等 方 分 发 。 当 Alice 要 呼叫 Bob 时 ， 
她 的 客户 搜索 该 分 布 式 索引 以 决定 Bob 的 当前 IP 地 址 。 因 为 Skype 协议 是 专用 的 ， 所 以 当 
前 并 不 知道 该 索引 映射 是 怎样 跨越 这 些 超级 对 等 方 进行 组 织 的 ， 尽 管 采用 某 种 形式 的 DHT 
组 织 结构 是 非常 可 能 的 。 

P2P 技术 也 被 用 于 Skype 中 继 (relay) 中 ， 中 继 对 于 创建 家 庭 网 络 中 主机 之 间 的 呼叫 
是 有 用 的 。 许 多 家 庭 网 络 配置 提供 通过 NAT 接 人 因特网 ， 如 第 4 章 所 讨论 的 那样 。 前 面 
讲 过 NAT 防止 来 自家 庭 网 络 外 部 的 主机 发 起 的 对 家 庭 网 络 内 部 主机 的 连接 。 如 果 两 个 
Skype 呼叫 方 都 具有 NAT， 则 存在 一 个 问题 ， 即 任 一 方 都 不 能 接受 由 其 他 一 方 发 起 的 呼叫 ， 
使 得 呼叫 看 起 来 不 可 能 实现 。 明 智 地 使 用 超级 对 等 方 和 中 继 很 好 地 解决 了 这 个 问题 。 假 设 
当 Alice 注册 进入 系统 ， 她 被 指派 了 一 个 非 NAT 的 超级 对 等 方 并 对 那个 超级 对 等 方 发 起 一 
个 会 话 。( 因为 是 Alice 发 起 了 该 会 话 ， 所 以 她 的 NAT 允许 该 会 话 。) 这 个 会 话 允 许 Alice 
和 她 的 超级 对 等 方 交换 控制 报 文 。 当 Bob 注册 进入 系统 时 发 生 了 同样 的 事情 。 此 时 ， 当 
Alice 要 呼叫 Bob ， 她 通知 她 的 超级 对 等 方 ， 超 级 对 等 方 依次 通知 Bob 的 超级 对 等 方 ，Bob 
的 超级 对 等 方 依 次 通知 Bob 说 “Alice ”被 叫 对 等 方 
的 入 呼叫 到 了 ”。 如 果 Bob 接受 了 该 呼 5 
叫 ， 这 两 个 超级 对 等 方 选择 一 个 第 三 
方 非 NAT 超级 对 等 方 ( 即 中 继 对 等 
方 ) ， 中 继 对 等 方 的 工作 是 中 继 Alice 
和 Bob 的 数据 。Alice 和 Bob 的 超级 对 
等 方 则 分 别 指示 Alice 和 Bob 与 该 中 继 
发 起 会 话 。 如 图 9-7 所 示 ，Alice WA 。 
it “Alice 到 中 继 ” 连 接 向 该 中 继 发 送 
语音 分 组 (该 连接 由 Alice Riv), 并 
且 该 中 继 经 “中 继 到 Bob” 连 接 转 发 
这 些 分 组 〈 该 连接 由 Bob 发 起 ); 从 
Bob 到 Alice 的 分 组 反方 向 地 流 经 相同 
的 两 条 中 继 连 接 。 瞧 ! Bob 和 Alice 有 
了 一 条 端 到 端 连 接 ， 即 使 他 们 都 不 能 本 
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接受 一 条 源 于 外 部 的 会 话 。 

到 现在 为 止 ， 我 们 有 关 Skype 的 讨论 关注 涉及 两 人 的 呼叫 。 现 在 我 们 观察 多 方 音频 会 
议 呼叫 。 对 于 W >2 个 参与 者 ， 如 果 每 个 用 户 希 望 向 每 个 其 他 NN -1 个 用 户 发 送 它 的 音频 
流 的 一 个 副本 ， 则 为 支持 该 音频 会 议 总 共 VN(N=-1) 个 音频 流 将 需要 发 送 到 网 络 中 去 。 为 
了 减少 这 种 带宽 使 用 ，Skype 应 用 了 一 种 明智 的 发 送 技术 。 具 体 而 言 ， 每 个 用 户 向 会 议 发 
起 方 发 送 它 的 音频 流 。 会 议 发 起 方 将 这 些 音频 流 结合 为 一 个 流 〈 基 本 上 是 将 所 有 的 音频 信 
号 加 在 一 起 ) ， 然 后 再 向 每 个 其 他 N - 1 个 参与 者 发 送 每 个 结合 流 的 一 个 副本 。 以 这 种 方 
式 ， 流 的 数量 被 减少 到 2(N-1) 条 。 对 普通 的 两 人 视频 会 议 ，Skype 路 由 对 等 方 到 对 等 方 
呼叫 ， 除 非 需要 NAT 穿越 ， 此 时 呼叫 通过 一 个 非 NAT 对 等 方 中 继 ， 如 前 面 所 述 。 对 于 一 
个 涉及 N >2 个 参与 者 的 视频 会 议 呼叫 ， 由 于 视频 媒体 的 性 质 ，Skype 不 像 对 语音 呼叫 那 
样 在 一 个 位 置 将 呼叫 结合 进 一 条 流 中 ， 然 后 将 流向 所 有 参与 者 重新 分 发 。 相 反 ， 每 个 参与 
者 的 视频 流 被 路 由 到 一 个 服务 器 集群 (2011 年 该 服务 器 集群 位 于 爱沙尼亚 ) ， 该 集群 依次 
将 -1 个 其 他 参与 者 的 VN-1 条 流 中 继 到 每 个 参与 者 [Zhang X 2012 ] 。 你 可 能 想 知道 为 
什么 每 个 参与 者 向 服务 器 而 不 是 向 每 个 其 他 N -1 其 他 参与 者 直接 发 送 其 视频 流 的 副本 呢 ? 
的 确 ， 对 两 种 方法 而 言 ，N(N -1) 个 视频 流 正 由 会 议 中 的 V 个 参与 者 共同 接收 。 其 原因 
是 ， 在 大 多 数 接 入 链 路 中 上 行 链 路 带宽 比 下 行 链 路 带宽 要 低 得 多 ， 上 行 链 路 可 能 不 能 支持 
使 用 P2P 方法 的 入-1 条 流 。 

诸如 Skype, QQ 和 Google Talk 等 VoIP 系统 引发 了 对 隐私 性 的 新 关注 。 具 体 而 言 ， 当 
Alice 和 Bob 经 过 VoIP 通信 ，Alice 能 够 嗅 探 到 Bob 的 IP 地址 ， 进 而 使 用 地 理 定位 服务 
[ MaxMind 2016; Quova 2016] 来 确定 Bob 的 当前 位 置 和 ISP (例如 他 的 工作 或 家 庭 ISP) 。 
事实 上 ，Alice 使 用 Skype 能 够 在 呼叫 创建 期 间 阻 挡 特定 的 分 组 传输 ， 这 样 她 获得 Bob 当前 
(比如 说 每 个 小 时 ) 的 四 地 址 ， 而 Bob 并 不 知道 他 正 被 跟踪 ， IFA Alice 不 在 Bob 的 接触 
列表 上 。 此 外 ， 从 Skype 发 现 的 IP 地址 能 被 关联 到 在 BitTorrent 中 发 现 的 IP 地 址 ， 因 此 
- Alice 能 够 确定 Bob 正在 下 载 的 文件 [LeBlond 2011], 。 此 外 ， 通 过 进行 流 中 分 组 长 度 的 流 
量 分 析 ， 可 能 部 分 解密 一 个 Skype 呼叫 [White 2011 ] 。 


9.4 ”实时 会 话 式 应 用 的 协议 


实时 会 话 式 应 用 (包括 VoIP 和 视频 会 议 ) 引人入胜 并 且 非 常 流行 。 因 此 标准 机 构 如 
IETF 和 ITU 多 年 来 一 直 忙 于 (而 且 要 继续 忙 下 去 !) 苦心 推 殴 这 类 应 用 的 标准 是 毫 不 奇怪 
的 。 借 助 于 实时 会 话 式 应 用 的 适当 标准 ， 各 个 独立 公司 正在 创造 新 的 能 够 互相 操作 的 产 
品 。 在 本 节 中 ， 我们 探讨 用 于 实时 会 话 式 应 用 的 RTP 和 SIP。 这 两 个 标准 正 广泛 地 应 用 于 
工业 产品 中 。 


9.4.1 RTP 


在 前 一 节 中 ， 我 们 知道 VoIP 应 用 的 发 送 端 在 将 块 传递 给 运输 层 之 前 为 它们 附加 上 首 
部 字段 。 这 些 首部 字段 包括 了 序号 和 时 间 截 。 因 为 大 多 数 多 媒体 网 络 应 用 能 够 利用 序号 和 
时 间 惟 ， 因 此 有 一 个 包括 音频 /视频 数据 、 序 号 、 时 间 惟 以 及 其 他 潜在 有 用 字段 的 标准 分 
组 结构 是 方便 的 。 定 义 在 RFC 3550 中 的 RTP 就 是 这 样 一 个 标准 。RTP 能 够 用 于 传输 通用 
格式 ， 如 用 于 声音 的 PCM、ACC 和 MP3 ， 用 于 视频 的 MPEG 和 H.263。 它 也 可 以 用 于 传输 
专用 的 声音 和 视频 格式 。 目 前 ，RTP 在 许多 产品 和 研究 原型 中 得 到 广泛 实现 。 它 也 是 其 他 
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重要 的 实时 交互 协议 (如 STP) 的 补充 。 

本 节 我 们 介绍 RTP。 我 们 也 鼓励 读者 去 访问 Henning Schulzrinne 的 RTP 站 点 [ Schul- 
zrinne-RTP 2012] ， 该 网 站 提供 有 关 这 个 主题 的 很 多 信息 。 读 者 也 可 以 访问 RAT 站 点 
[RAT 2012] ， 它 记载 了 使 用 RTP 的 VoIP 应 用 。 

1. RTP 基础 

RTP 通常 运行 在 UDP 之 上 。 发 送 端 在 RTP 分 组 中 封装 媒体 块 ， 然 后 在 UDP 报 文 段 中 
封装 该 分 组 ， 然 后 将 该 报 文 段 递交 给 于。 接收 端 从 UDP 报 文 段 中 提取 出 这 个 RTP 分 组 ， 
然后 从 RTP 分 组 中 提取 出 媒体 块 ， 并 将 这 个 块 传递 给 媒体 播放 器 来 解码 和 呈现 。 

举例 来 说 ， 考 虑 使 用 RTP 来 传输 语音 。 假 设 语音 源 采 用 了 64kbps 的 PCM 编码 (也 就 
是 采样 、 量 化 和 数字 化 ) 。 再 假设 应 用 程序 在 20ms 块 中 收集 这 些 编码 数据 ， 也 就 是 一 个 块 
中 有 160 字 节 。 发 送 端 在 每 个 语音 数据 块 的 前 面 加 上 一 个 RTP 首部 (RTP header) ， 这 个 
首部 包括 音频 编码 的 类 型 、 序 号 和 时 间 戳 。RTP 首部 通常 是 12 字 节 。 音 频 块 和 RTP 首部 
一 起 形成 RTP 分 组 (RTP packet) 。 然 后 向 UDP 套 接 字 接 口 发 送 该 RTP 分 组 。 在 接收 端 ， 
应 用 程序 从 它 的 套 接 字 接 口 收 到 该 RTP 分 组 ， 从 RTP 分 组 中 提取 出 该 音频 块 ， 并 且 使 用 
RTP 分 组 的 首部 字段 来 适当 地 解码 和 播放 该 音频 块 。 

如 果 一 个 应 用 程序 集成 了 RTP， 而 非 一 种 提供 负载 类 型 、 序 号 或 者 时 间 惟 的 专用 方 
案 ， 则 该 应 用 程序 将 更 容易 和 其 他 网 络 的 多 媒体 应 用 程序 互 操 作 。 例 如 ， 如 果 两 个 不 同 的 
公司 都 开发 VoIP 软件 ， 并 且 都 在 它们 的 产品 中 集成 了 RTP， 则 希望 使 用 一 种 VoIP 产品 的 
用 户 能 够 和 使 用 另 一 种 VoIP 产品 的 用 户 进行 通信 。 在 9. 4.2 节 ， 我 们 将 看 到 RTP 经 常 和 
SIP 一 起 使 用 ，SIP 是 一 种 因特网 电话 的 重要 标准 。 

应 该 强调 的 是 ，RTP 并 不 提供 任何 机 制 来 确保 数据 的 及 时 交付 ,或 者 提供 其 他 服务 质 
Ht (QoS) 保证 ; 它 甚至 不 保证 分 组 的 交付 ， 或 防止 分 组 的 失 序 交付 。RTP 封装 的 东西 确 
仅 为 端 系统 所 见 。 路 由 器 不 区 分 携带 RTP 分 组 的 IP 数据 报 和 不 携带 RTP 分 组 的 下 数 
据 报 。 

RTP 允许 为 每 个 源 (例如 一 架 照 相机 或 者 一 个 麦克 风 ) 分 配 一 个 它 自己 的 独立 RTP 
分 组 流 。 例 如 ， 对 于 在 两 个 参与 者 之 间 的 一 个 视频 会 议 ， 可 能 打开 4 个 RTP 流 ， 即 两 个 流 
传输 音频 (一 个 方向 一 个 )， 两 个 流传 输 视频 (也 是 一 个 方向 一 个 ) 。 然 而 ， 在 编码 过 程 
中 很 多 流行 的 编码 技术 (包括 MPEG] 和 MPEG2) 将 音频 和 视频 搁 绑 在 单个 流 中 。 当 音频 
和 视频 与 编码 器 捆绑 时 ， 每 个 方向 只 产生 一 个 RTP 流 。 

RTP 分 组 并 非 限 用 于 单 播 应 用 ， 它 们 也 可 以 经 过 一 对 多 和 多 对 多 的 多 播 树 发 送 。 对 于 
一 个 多 对 多 的 多 播 会 话 ， 所 有 的 会 话 发 送 方 和 源 通 常 使 用 同样 的 多 播 组 来 发 送 它们 的 RTP 
流 。 在 一 起 使 用 的 RTP 多 播 流 ， 例 如 在 视频 会 议 应 用 中 从 多 个 发 送 方 发 出 的 音频 和 视频 
流 ， 同 属于 一 个 RTP Sis (RTP session), 

2. RTP 分 组 首部 字段 

如 图 9-8 所 示 ，4 个 主要 的 RTP 分 组 首部 字段 是 有 效 载荷 类 型 、 序 号 、 时 间 惟 和 源 标 


识 符 字段 。 
a aaa RIES Ce a: 


图 9-8 RTP 首部 字段 
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RTP 分 组 中 的 有 效 载荷 类 型 字段 的 长 度 是 7 比特 。 对 于 音频 流 ， 有 效 载荷 类 型 字段 用 
于 指示 所 使 用 的 音频 编码 类 型 (例如 PCM、 适 应 性 增 量 调制 、 线 性 预测 编码 ) 。 如 果 发 送 
方 在 会 话 过 程 中 决定 改变 编码 ， 发 送 方 可 以 通过 该 有 效 载荷 类 型 字段 来 通知 接收 方 这 种 变 
化 。 发 送 方 可 能 要 通过 改变 该 编码 来 提高 语音 质量 或 者 减 小 RTP 流 比特 率 。 表 9-2 列 出 了 
当前 RTP 支持 的 一 些 音频 有 效 载荷 类 型 。 


表 9-2 RIP 支持 的 一 些 音频 有 效 载荷 类 型 


























对 于 一 个 视频 流 ， 有 效 载荷 类 型 用 于 指示 视频 编码 类 型 (例如 运动 JPEG、MPEG1、 
MPEG2、H. 261 ) 。 发 送 方 也 可 以 在 会 话 期 间 动 态 改变 视频 编码 。 表 9-3 列 出 了 当前 RTP 
支持 的 一 些 视频 有 效 载荷 类 型 。 


表 9-3 RTP 支持 的 一 些 视频 有 效 载 荷 类 型 





有 效 载荷 类 型 编号 视频 格式 有 效 载荷 类 型 编号 视频 格式 


其 他 重要 的 字段 如 下 : 

。 序号 字段 。 序 号 字段 长 为 16 比特 。 每 发 送 一 个 RIP 分 组 则 该 序号 增加 1， 而 且 接 
收 方 可 以 用 该 序号 来 检测 丢 包 和 恢复 分 组 序列 。 例 如 ， 如 果 应 用 的 接收 方 收 到 的 
RTP 分 组 流 在 序号 86 和 89 之 间 存 在 一 个 间隙， 那么 接收 方 则 知道 分 组 87 和 88 丢 
失 了 。 那 么 接收 方 能 够 设法 来 隐藏 该 丢失 数据 。 

。 时 间 惟 字段 。 时 间 戳 字段 长 32 比特 。 它 反映 了 RTP 数据 分 组 中 的 第 一 个 字 节 的 采 
样 时 刻 。 如 我 们 在 上 一 节 所 见 ， 接 收 方 能 够 使 用 时 间 截 来 去 除 网 络 中 引入 的 分 组 
时 延 拌 动 ， 提 供 接 收 方 的 同步 播放 。 时 间 惟 是 从 发 送 方 的 采样 时 钟 中 获得 的 。 举 
例 来 说 ， 对 于 音频 的 每 个 采样 周期 (例如 对 于 8kHz 的 采样 时 钟 每 125hs 为 一 个 周 
期 ) 时 间 戳 时 钟 增加 1; 如 果 该 音频 应 用 产生 由 160 个 编码 采样 组 成 的 块 的 话 ， 那 
么 当 源 激活 时 ， 对 每 个 RTP 分 组 则 时 间 惟 增加 160。 即 使 源 未 激活 ， 该 时 间 戳 时 
钟 也 将 继续 以 恒定 速率 增加 。 

。 同步 源 标 识 符 (SSRC)。SSRC 字段 长 为 32 比特 。 它 标识 了 RTP 流 的 源 。 通 常 在 
RIP 会 话 中 的 每 个 流 都 有 一 个 不 同 的 SSRC。SSRC 不 是 发 送 方 的 全 地址 ,而 是 当 
新 的 流 开始 时 源 随机 分 配 的 一 个 数 。 两 个 流 被 分 配 相同 SSRC 的 概率 是 很 小 的 。 如 
果 发 生 了 ， 这 两 个 源 应 当选 择 一 个 新 的 SSRC 值 。 


9.4.2 SIP 


定义 在 [RFC 3261; RFC 5411] 中 的 会 话 发 起 协议 (Session Initiation Protocol, SIP) 
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是 一 个 开放 和 轻型 的 协议 ， 其 功能 如 下 : 
。 提供 了 在 主 叫 者 和 被 叫 者 之 间 经 卫 网络 创建 呼叫 的 机 制 。 它 允许 主 叫 者 通知 
被 叫 者 它 要 开始 一 个 呼叫 。 它 允许 参与 者 约定 媒体 编码 ， 也 允许 参与 者 结束 
呼叫 。 
。 提供 了 主 叫 者 确定 被 叫 者 的 当前 IP 地 址 的 机 制 。 因 为 用 户 可 能 动态 地 分 配 到 地 址 
(使 用 DHCP) ， 而 且 因为 它们 可 能 有 多 个 P 设备 ， 每 个 都 有 一 个 不 同 的 IP 地 址 ， 
所 以 用 户 不 具有 单一 的 、 固 定 的 IP 地 址 。 
。 提供 了 用 于 呼叫 管理 的 机 制 ， 这 些 机 制 包括 在 呼叫 期 间 增 加 新 媒体 流 、 在 呼叫 期 
间 改 变 编码 、 在 呼叫 期 间 邀 请 新 的 参与 者 、 呼 叫 转移 和 呼叫 保持 等 。 
1. 向 已 知 IP 地 址 建立 一 个 呼叫 
为 了 理解 SIP 的 要 素 ， 最 好 看 一 个 具体 的 例子 。 在 这 个 例子 中 ，Alice 在 使 用 PC， 并 
且 她 要 呼叫 Bob Bob 也 在 使 用 PC 工作 。Alice 和 Bob 的 PC 都 配 有 基于 SIP 的 软件 来 产生 
和 接收 电话 呼叫 。 在 这 个 初始 的 例子 中 ， 我 们 将 假设 Alice 知道 Bob PC 的 全 地 址 。 图 9-9 
描述 了 这 个 SIP 呼叫 建立 的 过 程 。 





Alice Bob 
167.180.112.24 193.64.210.89 
INVITE bob : 
@193.64.21 
= 64.210, 
a 167.180.112.24 ý 

=audio 38060 RTP/AVP 0 : 
端口 5060 ， 

00K og Bob ee 
: c=IN IP4 193.64.219- ani $ 
- audio 48753 RTPA : 
: 端口 5060 : 
, ACK : 
` 端口 5060 5 
: h 律 音频 : 
: 端口 38060 Ah | Me al N Lie : 
: GSM : 
: A | | | 5 有 N i 端口 48753 ; 
时 v 

时 间 时 间 


9-9 > Alice 知道 Bob 的 全 地 址 时 的 SIP 呼叫 建立 过 程 


在 图 9-9 中 ， 我 们 看 到 当 Alice 给 Bob 发 送 一 个 INVITE 报 文 (这 类 似 于 HTTP 请 求 报 
X) 时 , 一 个 SP 会话 开始 了 。 该 INVITE 报 文通 过 UDP 发 送 给 SIP 的 周知 端口 5060。( SIP 
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报 文 也 可 以 经 TCP 发 送 。) 该 INVITE 报 文 包括 了 对 Bob 的 标识 (bob@ 193. 64. 210. 89)、 
Alice 当前 IP 地 址 的 指示 、Alice 希望 接收 的 音频 的 指示 (该 音频 以 格式 AVP 0 编码 ， 即 u 
律 PCM 编码 ， 并 在 RTP 中 封装 ) ， 以 及 她 希望 在 端口 38060 接收 RTP 分 组 的 指示 。 在 收 
到 了 Alice 的 INVITE 报 文 之 后 ，Bob 发 送 一 个 SIP 响应 报 文 (该 报 文 类 似 HTTP 的 响应 报 
文 ) 。 该 响应 SUP 报 文 也 被 发 送 到 SIP 端口 5060。Bob 的 响应 包括 一 个 200 OK 和 他 的 让 地 
址 的 指示 、 他 希望 接收 的 编码 和 分 组 化 ， 以 及 音频 数据 应 该 发 送 到 达 的 端口 号 。 注 意 到 在 
这 个 例子 中 ，Alice 和 Bob 准备 使 用 不 同 的 音频 编码 机 制 : 要 求 Alice 使 用 GSM 来 对 她 的 
音频 编码 ， 而 要 求 Bob 使 用 p HE PCM 对 他 的 音频 编码 。 在 接收 到 Bob 的 响应 后 ，Alice 向 
Bob 发 送 SIP 确认 报 文 。 在 这 个 SIP 事务 之 后 ，Bob 和 Alice 可 以 交谈 了 。 (为 了 看 起 来 清 
晰 ， 图 9-9 显示 Alice 在 Bob 之 后 说 话 ， 但 是 事实 上 他 们 通常 可 以 同时 进行 交谈 。) Bob 会 
根据 要 求 对 音频 进行 编码 和 分 组 化 ， 并 将 音频 分 组 发 送 给 IP 地 址 167. 180. 112. 24 的 端口 
号 38060, Alice 也 会 根据 要 求 对 音频 进行 编码 和 分 组 化 ， 并 将 音频 分 组 发 送 给 下 地 址 
193. 64. 210. 89 的 端口 号 48753 。 

从 这 个 简单 的 例子 我 们 学 到 了 一 些 SIP 的 关键 特性 。 第 一 ，SIP 是 一 个 带 外 协议 ， 即 
发 送 和 接收 SIP 报 文 使 用 了 一 个 不 同 于 发 送 和 接收 媒体 数据 的 套 接 字 。 第 二 ，SIP 报 文本 
身 是 可 读 的 ASCII， 这 与 HTTP 报 文 类 似 。 第 三 ，SIP 要 求 所 有 的 报 文 都 要 确认 ， 因 此 它 能 
够 在 UDP 或 者 TCP 上 运行 。 

在 这 个 例子 中 ， 我 们 考虑 一 下 如 果 Bob 没有 上 At PCM 编 解码 器 用 于 音频 编码 将 会 发 
生 什 么 情况 。 在 这 种 情况 下 ，Bob 不 用 200 OK 来 响应 ， 而 可 能 用 一 个 606 Not Acceptable 
(不 可 接受 ) 来 响应 ， 并 在 报 文 中 列 出 他 能 够 使 用 的 所 有 编 解码 。 然 后 Alice 从 中 选择 一 个 
编 解 码 ， 并 发 送 另 一 个 INVITE 报 文 ， 以 此 通告 了 已 选择 的 编 解 码 器 。Bob 也 能 够 直接 通 
过 发 送 某 个 拒绝 应 答 代码 来 直接 拒绝 该 呼叫 。 (有 很 多 这 种 代码 ， 包 括 “busy È)” 
“gone (离开 )”“payment (付费 )” 和 “forbidden (禁止 )”。) 

2. SIP 地 址 


在 前 面 的 例子 中 ，Bob 的 SIP 地 址 是 sip: bob@ 193. 64. 210. 89。 然 而 ， 我 们 希望 许多 
(即使 不 是 大 多 数 ) SIP 地 址 类 似 于 电子 邮件 地 址 。 例 如 ，Bob 的 地 址 可 以 是 sp: bob@ 
domain. com。 当 Alice 的 SIP 设备 发 送 INVITE 报 文 ， 该 报 文 包括 这 种 类 似 于 电子 邮件 地 址 
的 地 址 ; 然后 SIP 的 基本 设施 将 该 报 文 转发 给 Bob 正在 使 用 的 全 设备 (如 我 们 下 面 要 讨 
论 的 那样 )。 其 他 可 能 的 SIP 地 址 形式 可 以 是 Bob 过 去 的 电话 号 码 或 者 只 是 Bob 的 名 字 / 中 
间 名 /姓氏 (假设 它 是 唯一 的 ) 。 

SIP 地 址 的 一 个 有 趣 特点 是 它们 能 够 被 包括 在 Web 页 面 中 ， 就 像 人 们 的 电子 邮件 地 址 
用 mailto URL 形式 包含 在 Web 页 面 中 那样 。 例 如 ,假设 Bob 有 个 人 主页 ， 并 且 他 要 为 这 
个 主页 的 访问 者 提供 一 个 呼叫 他 的 方法 。 于 是 他 可 能 只 是 在 主页 中 包括 该 URL sip: bob@ 
domain. com。 当 访问 者 点 击 该 URL， 访 问 者 设备 中 的 SIP 应 用 将 启动 ， 并 向 Bob 发 送 IN- 
VITE 报 文 。 

3. SIP 报 文 


在 这 个 SP 简短 的 介绍 中 ， 我 们 无 法 包括 所 有 SIP 报 文 类 型 和 首部 ， 而 只 是 简要 地 浏 
览 一 下 SIP INVITE 报 文 ， 以 及 少数 通用 的 首部 行 。 我 们 再 假设 Alice 要 对 Bob 发 起 VoIP 呼 
叫 ， 此 时 Alice 只 知道 Bob 的 SIP 地 址 bob@ domain. com， 并 不 知道 Bob 正在 使 用 的 设备 的 
IP 地 址 。 那 么 她 的 报 文 可 能 看 起 来 有 些 像 下 面 这 个 : 
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INVITE sip:bob@domain.com SIP/2.0 
Via: SIP/2.0/UDP 167.180.112.24 
From: sip:alice@hereway.com 

To: sip:bob@domain.com 

Call-ID: a2e3a@pigeon.hereway.com 
Content-Type: application/sdp 
Content-Length: 885 


c=IN IP4 167.180.112.24 
m=audio 38060 RTP/AVP 0 


这 个 INVITE 行 包括 SIP 的 版 本 ， 这 与 HTTP 请 求 报 文 一 样 。 任 何 时 候 SIP 报 文通 过 一 
个 SIP 设备 (包括 产生 该 报 文 的 设备 ) 时 ， 它 附加 上 一 个 Via 首部 来 指示 该 设备 的 I 地 
址 。( 我 们 不 久 将 看 到 通常 INVITE 报 文 在 到 达 被 叫 者 的 SIP 应 用 之 前 会 通过 很 多 SIP 设 
Ko) 与 电子 邮件 报 文 类 似 ，SIP 报 文 包括 一 个 From 首部 行 和 一 个 To 首部 行 。 该 报 文 包括 
一 个 Call-ID (呼叫 标识 符 )， 它 唯一 地 标识 该 呼叫 (类 似 电 子 邮 件 中 的 报 文 了 一) ; 包括 一 
个 Content-Type ( 内容 类 型 ) 首部 行 ， 定义 用 于 描述 包含 在 SP 报 文中 的 内 容 的 格式 ; 还 
包括 Content-Length (内 容 长 度 ) 首部 行 ， 提 供 报 文中 内 容 的 字 节 长 度 。 最 后 ， 在 一 个 回 
车 和 换行 之 后 ， 该 报 文 包含 内 容 部 分 。 在 这 个 例子 中 ， 内 容 提 供 了 有 关 Alice 的 IP 地 址 和 
Alice 要 如 何 接收 该 音频 的 信息 。 

4. 名 字 翻 译 和 用 户 定位 

在 图 9-9 的 例子 中 ， 我 们 假设 Alice 的 SIP 设备 知道 能 够 联系 到 Bob 的 IP Hott, (ASE 
这 种 假设 是 很 不 真实 的 ， 不 仅 因为 IP 地 址 通常 是 通过 DHCP 动态 分 配 的 ， 而且 Bob 可 能 
有 多 个 他 设备 (例如 ,在 家 里 、 工 作 中 和 汽车 里 有 不 同 的 设备 )。 因 此 现在 我 们 假设 
Alice 只 知道 Bob 的 电子 邮件 地 址 bob@ domain. com， 而 且 对 基于 SIP 的 呼叫 使 用 同样 的 地 
址 。 在 这 种 情况 下 ，Alice 需要 获得 用 户 bob@ domain. com 正在 使 用 的 设备 的 全 地址 。 为 
了 获得 它 ，Alice 创建 一 个 INVITE 报 文 ， 它 以 INVITE bob@ domain. com SIP/2.0 开始 ， 并 
将 该 报 文 发 送 给 一 个 SIP 代理 (SIP proxy) 。 该 代理 将 以 一 个 SIP 回答 来 响应 ,该 回答 中 
也 可 能 包含 bob@ domain. com 正在 使 用 的 设备 的 IP 地 址 。 该 回答 也 可 以 选择 包括 Bob 的 语 
音信 箱 的 IP 地 址 ,或 者 可 能 包括 一 个 Web 页 面 的 URL (上面 写 着 “Bob 在 睡觉 ， 请 不 要 
打扰 1”)。 代 理 返 回 的 结果 也 可 能 取决 于 呼叫 者 ; 如 果 呼 叫 是 Bob 的 妻子 发 出 的 ， 它 可 能 
接受 该 呼叫 ， 并 提供 IP Hoh; 如 果 呼 叫 是 Bob 的 岳母 发 出 的 ， 它 可 能 用 指向 “我 正在 睡 
觉 ” 的 Web 页 面 的 URL 来 响应 。 

现在 ， 你 可 能 想 知 道 这 个 代理 服务 器 是 怎样 确定 bob@ domain. com 现在 的 IP 地 址 的 ? 
为 了 回答 该 问题 ， 我 们 需要 讲 一 下 另 一 个 SIP 设备 ， 即 SIP 注册 器 (SIP registrar) 。 每 个 
SIP 用 户 都 有 一 个 相关 联 的 注册 器 。 任 何 时 候 用 户 在 设备 上 发 起 SIP 应 用 时 ， 该 应 用 给 注 
册 器 发 送 一 个 SP 注册 报 文 ， 通 知 注册 器 它 现在 的 IP 地 址 。 例 如 ， 当 Bob 在 他 的 PDA 上 
发 起 SIP 应 用 时 ， 该 应 用 将 发 送 一 个 类 似 于 下 述 内 容 的 报 文 : 


REGISTER sip:domain.com SIP/2.0 
Via: SIP/2.0/UDP 193.64.210.89 
From: sip:bob@domain.com 

To: sip:bob@domain.com 

Expires: 3600 


Bob 的 注册 器 跟踪 Bob 现在 的 IP 地 址 。 无 论 何 时 Bob 切换 到 一 个 新 的 SIP 设备 时 ， 该 
新 设备 将 发 送 一 个 新 的 注册 报 文 ， 指 示 该 新 的 全 地址 。 如 果 Bob 长 时 间 使 用 同样 的 设备 ， 
该 设备 将 发 送 刷 新 注册 报 文 ， 指 示 最 近 发 送 的 IP 地 址 仍然 有 效 。( 在 上 面 的 例子 中 ， 需 要 
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每 隔 3600 秒 发 送 刷 新 报 文 来 维护 在 注册 器 中 的 地 址 。) 值得 注意 的 是 注册 器 和 DNS 权威 
名 字 服 务 器 类 似 : DNS 服务 器 将 固定 的 用 户 名 翻译 到 固定 的 亿 地 址 ; SIP 注册 器 把 固定 的 
人 识别 标志 (例如 bob@ domain. com) 翻译 为 一 个 动态 的 了 P 地 址 。SIP 注册 器 和 SIP 代理 
通常 运行 在 同一 台 主 机 上 。 

现在 我 们 检查 一 下 Alice 的 SIP 代理 服务 器 是 如 何 获 得 Bob 当前 的 IP 地 址 的 。 从 上 面 
的 讨论 我 们 看 到 ， 代 理 服务 器 只 需要 转发 Alice 的 INVITE 报 文 给 Bob 的 注册 器 /代理 即 可 。 
然后 注册 器 /代理 将 该 报 文 转发 给 Bob 现在 的 SIP 设备 。 最 后 ， 在 已 收 到 了 Alice 的 INVITE 
报 文 之 后 ，Bob 可 以 向 Alice 发 送 一 个 SIP 应 答 。 

举例 来 说 ， 考 虑 图 9-10， 其 中 正在 217. 123. 56. 89 上 工作 的 jim@ umass. edu 要 对 正在 
197. 87. 54. 21 上 工作 的 keith@ upenn. edu 发 起 IP 语音 (VoIP) 会 话 。 采 用 下 面 的 步 又 ; 
Jim 向 umass 的 SIP 代理 发 送 INVITE 报 文 。@@ 该 代理 在 SIP 注册 器 upenn. edu 上 进行 
DNS 查询 (在 图 中 没有 显示 ) ， 并 将 该 报 文 转 发 给 注册 服务 器 。 四 因为 keith@ upenn. edu 
没有 在 注册 器 upenn 上 注册 ，upenn 注册 器 发 送 一 个 重 定 向 应 答 ， 指 示 它 应 该 试 一 试 
keith@ nyu. edu, @umass 的 代理 向 NYU 的 SIP 注册 器 发 送 INVITE 报 文 。@NYU 注册 器 知 
道 keith @ upenn. edu HJ IP 地址， 并 将 SIP 注 册 器 
INVITE 报 文 转发 给 正 运行 Keith 的 SIP 客 upenn.edu 
户 的 主机 197. 87.54.21, © ~ 图 通过 注册 
器 /代理 把 SIP 响应 返回 给 217. 123. 56. 89 
上 的 SIP 客户 。@@ 媒 体 直接 在 两 个 客户 之 
间 发 送 。 (还 有 一 个 SIP 确认 报 文 ， 图 中 SIP 注 册 器 
没有 画 出 来 。) — 

我 们 有 关 SIP 的 讨论 集中 在 语音 呼叫 | 
的 呼叫 发 起 方面 。SIP 通常 是 一 个 发 起 和 
“结束 呼叫 的 信 令 协议 ， 它 能 够 用 于 视频 会 
议 呼叫 和 基于 文本 的 会 话 。 事 实 上 ，SIP 
已 经 成 为 许多 即时 讯息 应 用 的 基本 组 件 。 
我 们 鼓励 希望 学 习 更 多 有 关 SIP 知识 的 读 
者 访问 Henning Schulzrinne 的 SIP Web 站 
点 [Schulzrinne-SIP 2016] 。 特 别 是 ， 你 在 
这 个 站 点 上 会 发 现 SIP 客户 和 服务 器 的 开 | SREP ek 
源 软 件 [SIP Software 2016 ] 。 


9.5 支持 多 媒体 的 网 络 


在 9.2 ~9.4 节 中 ,我 们 学 习 了 诸如 客户 缓存 、 预 取 、 对 可 用 带宽 的 适应 性 媒体 质量 、 
适应 性 播放 和 丢 包 缓解 技术 等 应 用 级 机 制 如 何 用 于 多 媒体 应 用 ， 以 改善 多 媒体 应 用 的 性 
能 。 我 们 也 学 习 了 内 容 分 发 网 和 P2P 覆盖 网 络 如 何 用 于 提供 系统 级 的 交付 多 媒体 内 容 的 方 
法 。 这 些 技 术 和 方法 都 被 设计 用 于 今天 的 尽力 而 为 因特网 。 的 确 ， 现 在 因特网 得 到 应 用 就 
是 因为 它 只 提供 单一 的 、 尽 力 而 为 类 型 的 服务 。 但 是 作为 计算 机 网 络 的 设计 者 ， 我 们 禁 不 
住 要 问 : 网 络 〈 而 不 是 应 用 程序 或 者 仅 应 用 级 的 基础 设施 ) 是 否 可 以 提供 支持 多 媒体 内 容 
交付 的 机 制 。 如 我 们 很 快 将 看 到 的 那样 ， 答 案 当然 是 肯定 的 ! 但 是 我 们 也 将 看 到 ， 许 多 这 





图 9-10 涉及 SIP 代理 与 注册 器 的 会 话 发 起 
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RIF 








样 的 新 网 络 级 机 制 还 没有 得 到 广泛 部 署 。 这 可 能 是 由 于 它们 的 复杂 性 和 下 列 事实 所 致 : 应 
用 级 基础 设施 以 及 尽力 而 为 服务 和 适当 定制 的 网 络 资源 (例如 带宽 ) 的 确 能 够 提供 “ 足 
够 好 的 ”( 即使 不 总 是 尽善尽美 的 ) 端 到 端 多 媒体 交付 服务 。 

表 9-4 总 结 了 能 够 对 多 媒体 应 用 提供 网 络 层 支持 的 三 种 宽泛 的 方法 。 






表 9-4 支持 多 媒体 应 用 的 三 种 网 络 层 方法 
















尽 可 能 利用 尽 | ”公平 处 理 所 有 MRE, CDN, M 
力 而 为 服务 盖 网 络 ， 网 络 级 资源 供给 | PO | “无 处 不 在 


区 分 服务 






每 连接 服务 质 
量 (QoS) 保证 | 地 流 处 理 不 同 





















不 同类 型 的 流 
量 处 理 不 同 


每 个 源 到 目的 






分 组 标识 ， 监 管 ， 调 度 

















分 组 标识 ,监管 ， 调 
度 ， 呼 叫 准 入 和 信 令 





© 尽 可 能 利用 尽力 而 为 服务 。 我 们 在 9. 2 ~ 9. 4 节 学 习 的 应 用 级 机 制 和 基础 设施 能 够 


成 功 地 用 于 定制 良好 的 网 络 一 一 该 网 络 中 偶然 出 现 丢 包 和 过 大 的 端 到 端 时 延 。 当 
预见 到 需求 增加 ，ISP 部 署 额 外 的 带宽 和 交换 能 力 以 持续 确保 满意 的 时 延 和 丢 包 性 . 
fig [Huang 2005]. 。 我 们 将 在 9.5.1 节 中 进一步 讨论 网 络 定 制 (network dimensio- 
ning) 。 

区 分 服务 。 自 因特网 的 早期 ， 就 已 经 设想 不 同类 型 的 流量 〈 例 如 ， 在 IPv4 分 组 首 
部 中 服务 类 型 字段 所 指示 的 类 型 ) 能 够 由 不 同类 型 的 服务 所 提供 ， 而 不 是 单一 的 
“以 不 变 应 万 变 ” 的 尽力 而 为 服务 。 使 用 区 分 服务 (differentiated service) ， 当 两 类 
流量 在 一 台 路 由 器 中 排队 时 ， 一 种 类 型 的 流量 可 以 给 定 严格 的 优 于 另 一 种 类 型 的 
流量 的 优先 权 。 例 如 ， 属 于 实时 会 话 式 应 用 的 分 组 由 于 其 严格 的 时 延 限制 ， 可 能 
会 给 定 优 于 其 他 分 组 的 优先 权 。 在 网 络 中 引入 区 分 服务 将 要 求 一 些 用 于 分 组 标记 
(指示 一 个 分 组 的 服务 类 型 ) 、 分 组 调度 和 其 他 方面 的 新 机 制 。 我 们 将 在 9. 5. 2 节 
和 9. 5.3 节 中 涉及 区 分 服务 以 及 实现 这 种 服务 的 新 网 络 机 制 。 

每 连接 服务 质量 (QoS) 保证。 使 用 每 连接 QoS 保证 ， 每 个 应 用 的 实例 显 式 地 预 
约 端 到 端 带宽 ,并 因此 具有 确保 的 端 到 端 性 能 。 硬 保证 (hard guarantee) 意味 着 
应 用 将 必定 接收 到 它 所 请 求 的 服务 质量 。 软 保证 (soft guarantee) 意味 着 应 用 将 以 
高 概率 接收 到 它 所 请 求 的 服务 质量 。 例如， 如 果 某 用 户 要 从 主机 A 向 主机 B 进行 
VoIP 呼叫 ， 该 用 户 的 VoIP 应 用 在 两 台 主 机 之 间 沿 着 路 径 在 每 条 链 路 上 显 式 地 预 留 
带宽 。 但 是 ， 人 允许 应 用 做 预约 和 请 求 网 络 同意 该 预约 ， 这 需要 一 些 大 的 变化 。 首 


， 先 ， 我 们 需要 一 个 协议 来 代表 应 用 程序 ， 从 发 送 方 到 其 接收 方 沿路 径 预约 链 路 带 


9; 5.1 


宽 。 第 二 ， 在 路 由 器 队列 中 将 需要 新 的 调度 策略 ， 使 每 连接 带宽 预约 能 够 兑现 。 
最 后 ， 为 了 进行 预约 ， 应 用 程序 必须 向 网 络 给 出 描述 来 说 明 它 们 希望 发 送 进 网 络 
的 流量 ， 并 且 网 络 将 需要 监管 每 个 应 用 程序 的 流量 以 确保 它 遵守 这 个 描述 。 当 这 
些 机 制 结合 时 ， 在 主机 和 路 由 器 中 要 求 新 的 和 复杂 的 软件 。 因 为 每 连接 QoS 保证 
服务 尚未 见 到 大 规模 部 署 ， 我 们 将 仅 在 9. 5. 4 节 中 简要 地 涉及 这 些 机 制 。 


定制 尽力 而 为 网 络 


从 根本 上 说 ， 支 持 多 媒体 应 用 的 困难 是 由 其 严格 的 性 能 要 求 引 起 的 ， 即 低 的 端 到 端 分 
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组 时 延 、 时 延 抖 动 和 丢 包 ， 而 事实 是 ， 无 论 何 时 网 络 变 得 拥塞 ， 都 将 出 现 较 大 的 分 组 时 
延 、 时 延 抖 动 和 丢 包 。 改 善 多 媒体 应 用 质量 的 第 一 种 方法 就 是 “在 问题 上 砸 钱 ”， 因 此 直 
接 避 免 资源 竞争 即 可 。 这 种 方法 常用 于 解决 有 关 资 源 受 限 的 任何 问题 。 在 网 络 多 媒体 的 场 
合 ， 这 意味 着 在 整个 网 络 中 提供 充足 的 链 路 带宽 ， 使 网 络 拥塞 及 其 导致 的 分 组 时 延 和 丢失 
RRS (或 仅 非常 少 地 ) 出 现 。 具 有 充足 的 链 路 带宽 ， 分 组 将 很 快 地 通过 今天 的 因特网 而 
没有 排队 时 延 或 丢失 。 从 许多 方面 看 ， 这 是 一 种 理想 的 情况 : 完美 地 执行 多 媒体 应 用 ， 用 
户 是 幸运 的 ， 所 有 要 求 都 能 够 满足 而 不 改变 因特网 尽力 而 为 的 体系 结构 。 
当然 ， 问 题 是 为 实现 这 种 极乐 世界 提供 多 大 容量 才 是 “充足 的 "， 以 及 提供 “充足 
的 ”带宽 的 成 本 从 ISP 的 商业 角度 来 说 是 否 实际 。 在 一 个 给 定 拓扑 中 为 网 络 链 路 提供 多 大 
容量 以 取得 给 定 水 平 的 性 能 的 问题 常 被 称 为 带宽 供给 (bandwidth provisioning) 。 如 何 设计 
一 个 网 络 拓 扑 (其 中 放置 一 些 路 由 器 ， 如 何 用 链 路 互联 这 些 路 由 器 ， 并 为 链 路 分 配 容量 ) 
以 取得 给 定 水 平 的 端 到 端 性 能 这 个 更 为 复杂 的 问题 常 被 称 为 网 络 定制 ( network dimensio- 
ning) 。 带 宽 供 给 和 网 络 定制 都 是 复杂 的 专题 ， 它 们 远 超 过 了 本 教科 书 的 范围 。 然 而 ， 我 
们 这 里 注意 到 ， 为 了 预测 两 个 网 络 端点 之 间 的 应 用 级 性 能 ， 必 须 处 理 下 列 问 题 ， 并 因此 提 
供 充足 的 容量 来 满足 应 用 的 性 能 要 求 。 
© 网 络 端 点 之 间 的 流量 需求 模型 。 这 些 模型 可 能 需要 定义 在 呼叫 层次 (例如 ， 用 户 
“到 达 ” 网 络 并 启动 端 到 端 应 用 ) 和 分 组 层次 (例如 ， 由 进行 中 的 应 用 所 产生 的 
分 组 )。 注 意 负载 可 能 随 着 时 间 而 变化 。 
© 定义 良好 的 性 能 要 求 。 例 如 ， 为 支持 诸如 会 话 式 多 媒体 应 用 等 时 延 敏 感 的 流量 ， 
其 性 能 要 求 可 能 是 : 分 组 的 端 到 端 时 延 大 于 最 大 可 容忍 时 延 的 概率 要 小 于 某 个 很 
小 的 值 [Fraleigh 2003 ] 。 
© 对 给 定 的 负载 模型 预测 端 到 端 性 能 的 模型 ， 以 及 求 出 最 小 成 本 带宽 分 配 (该 带宽 
分 配 将 导致 满足 所 有 用 户 的 需求 ) 的 技术 。 这 里 ， 研 究 人 员 正 忙于 研发 能 够 量化 
给 定 负载 下 的 性 能 的 性 能 模型 ， 以 及 能 求 出 满足 性 能 要 求 的 最 小 成 本 带宽 分 配 的 
优化 技术 。 
假定 今天 尽力 而 为 的 因特网 能 够 (从 技术 角度 讲 ) 以 适当 的 性 能 水 平 支持 多 媒体 流量 
(如 果 它 被 定制 成 这 样 的 话 ) ， 自 然 的 问题 是 为 什么 今天 的 因特网 满足 不 了 这 样 的 要 求 。 答 
案 基 本 上 是 经 济 上 和 组 织 上 的 原因 。 从 经 济 角 度 看 ， 用 户 将 愿意 向 其 ISP 支付 足够 多 的 费 
用 , 使 ISP 安装 充足 的 带宽 经 尽力 而 为 的 因特网 来 支持 多 媒体 应 用 吗 ? 组 织 问题 也 许 更 为 
令 人 气 蚀 。 注 意 到 在 两 个 多 媒体 端点 之 间 的 端 到 端 路 径 将 通过 多 个 ISP 的 网 络 。 从 组 织 角 
度 看 ; 这 些 ISP 将 愿意 合作 (也许 以 收入 共享 方式 ) 以 确保 端 到 端 路 径 被 适当 地 定制 来 支 
持 多 媒体 应 用 吗 ? 对 这 些 经 济 和 组 织 问 题 的 展望 ， 参 见 [Davies 2005 ] 。 对 于 供给 第 一 层 
主干 网 络 以 支持 时 延 敏 感 流量 的 展望 ， 参 见 [Fraleigh 2003 ] 。 


9.5.2 提供 多 种 类 型 的 服务 


也 许 对 今天 因特网 中 的 以 不 变 应 万 变 的 尽力 而 为 服务 而 言 ， 一 种 最 简单 的 强化 是 将 流 
量 划分 为 多 种 类 型 ， 并 为 这 些 不 同类 型 的 流量 提供 不 同等 级 的 服务 。 例 如 ， 某 ISP 可 能 要 
为 时 延 敏感 的 VoIP 或 电信 会 议 流量 比 为 电子 邮件 或 HTTP 等 弹性 流量 提供 更 高 的 服务 类 
型 (并 对 该 服务 收取 更 高 的 费用 ) 。 另 一 种 做 法 是 ，ISP 可 能 直接 向 愿意 对 这 种 改进 服务 
支付 更 多 费用 的 顾客 提供 更 高 质量 的 服务 。 一 些 住宅 有 线 接 人 ISP 和 蜂窝 无 线 接 人 IS 已 
经 采用 了 这 样 的 梯次 等 级 服务 ， 即 铂金 卡 服务 用 户 比 金 卡 服务 用 户 或 银 卡 服务 用 户 享有 更 





好 的 服务 性 能 。 

我 们 都 从 日 常生 活 中 熟悉 了 不 同类 型 的 服务 ， 如 航班 上 头等 舱 乘客 比 公务 舱 乘客 得 到 
更 好 的 服务 ， 公 务 舱 乘客 又 比 经 济 舱 乘 客 得 到 更 好 的 服务 ;VIP 在 活动 中 能 够 立即 进入 ， 
而 所 有 其 他 人 都 必须 排队 等 待 ; 在 某 些 国家 中 老年 人 被 尊重 ， 提 供 了 荣誉 座位 和 最 精细 的 
食物 。 重 要 的 是 注意 到 在 聚合 流量 中 〈 即 在 多 种 流量 类 型 中 而 不 是 单个 连接 中 ) 提供 了 这 
种 有 差别 的 服务 。 例 如 ， 所 有 头等 舱 乘客 被 一 视 同 仁 〈 没 有 哪个 头等 舱 乘 客 得 到 了 比 其 他 
头等 舱 乘 客 更 好 的 服务 ) ， 就 像 所 有 的 VoIP 分 组 在 网 络 中 得 到 了 相同 的 对 待 ， 与 它们 所 属 
的 特定 的 端 到 端 连 接 无 关 。 如 我 们 将 见 到 的 那样 ， 通 过 处 理 少量 的 流量 聚合 ， 而 不 是 大 量 
的 单个 连接 ， 提 供 好 于 尽力 而 为 服务 所 需要 的 新 型 网 络 机 制 能 够 保持 相对 简单 。 

早期 因特网 设计 者 的 心中 清晰 地 具有 这 种 多 种 类 型 服务 的 概念 。 回 想 第 4 章 中 IPv4 首 
部 中 的 服务 类 型 (ToS) 字段 。IEN123 [ISI 1979] 描述 也 呈现 在 IPv4 数据 报 的 原型 中 的 
ToS 字段 时 说 : “服务 类 型 [字段 ] 提供 了 所 希望 的 服务 质量 的 抽象 参数 的 指示 。 当 传输 
一 个 数据 报 通过 某 特定 网 络 时 ， 这 些 参 数 被 用 于 引导 实际 服务 参数 的 选择 。 几 种 网 络 提供 
了 服务 优先 权 ， 该 优先 权 以 某 种 方式 把 高 优先 权 流 量 看 得 比 其 他 流量 更 为 重要 。” 在 40 多 
年 前 ， 向 不 同等 级 的 流量 提供 不 同等 级 的 服务 的 设想 就 是 清晰 的 ! 然而 ,我 们 又 花费 了 等 
长 的 时 间 去 实现 这 种 愿景 。 

1. 促进 思考 的 场景 

下 面 用 几 种 促进 思考 的 场景 来 开始 我 
们 的 提供 多 种 类 型 服务 的 网 络 机 制 的 讨论 。 

图 9-11 表示 了 一 种 简单 的 网 络 场景 ， 
两 个 应 用 分 组 流产 生 于 位 于 一 个 局 域 网 的 
主机 Hl 和 H2， 它 们 的 目的 地 是 另 一 个 局 
域 网 的 主机 H3 和 H4。 在 这 两 个 局 域 网 上 
的 两 台 路 由 器 通过 一 条 1. SMbps 的 链 路 连 
接 起 来 。 我 们 假设 局 域 网 的 速度 远 远 高 于 
1.5Mbps， 并 且 关 注 路 由 器 R1 的 输出 队列 ; 
注意 到 如 果 HL 和 H2 的 总 计 发 送 速率 超过 
了 1.5Mbps， 分 组 时 延 和 丢 包 将 会 出 现 。 图 9-11 音频 应 用 与 FTP 应 用 的 竞争 
我 们 进一步 假设 1Mbps 的 音频 应 用 (例如 一 个 CD 质量 的 音频 呼叫 ) 共享 RI1 和 R 之 间 
1. 5Mbps 的 链 路 ， 同 时 从 H2 到 H4 有 一 个 HTTP Web 浏览 应 用 正在 下 载 一 个 Web 网 页 。 

在 尽力 而 为 服务 的 因特网 中 ,该 音频 和 HTTP 分 组 在 R 的 输出 队列 中 混合 ， 并 且 
(通常 ) 以 先进 先 出 (FIFO) 的 次 序 传输 。 在 这 种 情况 下 ， 来 自 Web 服务 器 的 突 发 分 组 可 
能 潜在 地 填充 满 这 个 队列 ， 引 起 IP 音频 分 组 过 度 延迟 或 者 由 于 RI 的 缓存 溢出 而 丢失 。 我 
们 应 该 如 何 解决 这 个 潜在 的 问题 呢 ? 假定 该 HTTP Web 浏览 应 用 没有 时 间 限 制 ， 我 们 的 直 
觉 也 许 是 在 RI 为 音频 分 组 分 配 严格 的 优先 级 。 在 一 个 严格 的 优先 级 调度 规则 下 ， 在 RI 
输出 缓存 的 音频 分 组 总 是 在 RI 输出 缓存 中 的 任何 HTTP 分 组 之 前 传输 。 对 音频 流量 而 言 ， 
ARI 到 R2 的 链 路 看 起 来 像 一 条 1. 5Mbps 专用 链 路 ， 而 对 于 HTTP 流量 仅 当 没有 音频 流量 
排队 时 ， 才 使 用 R1 到 R2 的 链 路 。 为 了 让 RI 在 它 的 队列 中 区 分 音频 和 FTP 分组， 每 个 分 
组 必须 被 标记 为 属于 这 两 类 流量 中 的 哪 一 类 。 这 是 IPv4 中 服务 类 型 (ToS) 字段 的 最 初 目 
的 。 显 而 易 见 ， 这 则 是 我 们 对 需要 提供 多 种 类 型 流量 机 制 的 第 1 个 见解 。 
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见解 1: 标记 分 组 (packet marking) 使 得 路 由 器 区 分 属于 不 同类 型 流量 的 分 组 。 

注意 到 尽管 我 们 的 例子 考虑 到 竞争 性 的 多 媒体 和 弹性 流 ， 但 是 相同 的 见解 应 用 于 实现 了 铀 
金 卡 、 金 卡 和 银 卡 服务 类 型 的 情况 ， 即 仍 需要 标记 分 组 机 制 以 指示 分 组 属于 哪个 类 型 的 服务 。 

现在 假设 路 由 器 被 配置 为 给 标记 为 属于 1Mbps 音频 应 用 的 分 组 赋予 高 优先 级 。 因 为 输 
出 链 路 速度 是 1.5Mbps， 即 使 HTTP 分 组 得 到 较 低 的 优先 级 ， 它 们 仍然 可 以 收 到 平均 
0. SMbps 的 传输 服务 。 但 是 如 果 音 频 应 用 开始 以 1. SMbps 或 者 更 高 的 速率 (或 者 恶意 的 ， 
或 者 由 于 应 用 的 差错 ) 发 送 分 组 ， 那 会 出 现 什么 样 的 情况 呢 ? 在 这 种 情况 下 ，HTTP 分 组 
HRI, EREE R1 到 R2 的 链 路 上 得 不 到 任何 服务 。 如 果 多 个 应 用 (例如 ， 多 个 音频 
呼叫 ) 都 具有 同等 的 服务 类 型 ， 共 享 一 段 链 路 带宽 ， 那么 也 会 出 现 类 似 问题 ， 即 它们 也 可 
能 共同 饿 死 该 HTTP 会 话 。 理 想 情况 下 ， 一 种 服务 要 与 各 类 流量 有 隔离 度 ， 以 保护 一 种 流 
量 类 型 免 受 其 他 流量 类 型 干扰 。 这 种 保护 能 够 在 网 络 中 的 不 同 地 方 实现 ， 在 每 台 路 由 器 


中 ,在 进入 网 络 的 首 个 人 口 ， 或 在 网 络 边 
界 域 间 。 这 则 是 我 们 的 第 2 个 见解 。 

见解 2: 希望 在 流量 类 型 之 间 提 供 流 量 
隔离 (traffic isolation) 的 度 ， 以 便 一 类 流 
量 不 会 受到 另 一 类 异常 流量 的 负面 影响 。 

我 们 将 考察 在 流量 类 型 之 间 提 供 这 种 
隔离 的 特定 机 制 。 这 里 我 们 注意 到 ， 有 两 
大 类 方法 可 以 使 用 。 首 先 ， 可 以 执行 如 
图 9-12 所 示 的 流量 监管 (traffic policing) 
方法 。 如 果 流 量 类 型 或 流 必须 满足 一 定 的 
准则 (例如 ， 音频 流 不 超过 1Mbps 的 峰值 
速率 ) ， 那 么 可 以 设置 一 个 监管 机 制 来 确保 
. 这些 准 则 的 确 被 遵守 。 如 果 被 监管 的 应 用 
行为 异常 ， 这 个 监管 机 制 将 采取 某 种 行动 
(例如 ， 丢 弃 或 者 延 时 那些 违反 这 些 准则 的 
分 组 ) ， 以 便 实际 进入 网 络 的 流量 符合 这 些 
准则 。 我 们 很 快 将 考察 的 漏 桶 机 制 也 许 是 
使 用 最 广泛 的 监管 机 制 。 在 图 9-12 中 ， 分 
组 分 类 和 标记 机 制 ( 见解 1) 以 及 监管 机 制 
(见解 2)- 都 一 起 在 网 络 的 边缘 实现 ， 或 在 
端 系 统 中 实现 ， 或 在 边界 路 由 器 中 实现 。 

为 流量 类 型 之 间 提 供 隔离 的 一 种 互补 
的 方法 是 ， 链 路 级 的 分 组 调度 机 制 为 每 种 
类 型 明确 地 分 配 固定 量 的 链 路 带宽 。 例 如 ， 
在 R1 能 够 给 音频 类 型 分 配 1Mbps， 能 够 给 
HTTP 流 分 配 0. 5Mbps。 在 这 种 情况 下 ， 音 
频 和 HTTP 流 分 别 看 到 了 容量 为 1. 0Mbps 和 
0. 5Mbps 的 逻辑 链 路 ， 如 图 9-13 所 示 。 通 
过 严格 执行 链 路 级 的 带宽 分 配 ， 一 种 类 型 








图 例 : 
CX) 测定 和 监管 用 标记 
图 9-12 监管 (与 标记 ) 音频 与 HTTP 流量 类 型 
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图 9-13 音频 与 HTTP 流量 类 型 的 逻辑 隔离 
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仅 能 够 使 用 已 经 分 配 的 带宽 量 ; 特别 是 ， 它 不 能 利用 其 他 应 用 现在 未 使 用 的 带宽 。 例 如 ， 
如 果 音 频 流 静默 了 〈 例 如， 如果 谈话 者 停顿 ， 不 产生 音频 分 组 ) HTTP 流 在 RI 到 R2 的 
链 路 上 的 传输 带宽 仍然 不 能 够 超过 0. 5SMbps， 即 使 音频 流 分 配 的 Mbps 带宽 在 那个 瞬间 没 
有 使 用 。 由 于 带宽 是 一 种 “使 用 它 或 丢失 它 (use-it-or-lose-it)” 的 资源 ， 没 有 理由 妨碍 
HTTP 流量 使 用 没有 由 音频 流 使 用 的 带宽 。 我 们 将 希望 尽 可 能 高 效 地 使 用 带宽 ， 当 能 够 以 
别 的 方法 使 用 它 时 决 不 浪费 带宽 。 这 引发 我 们 的 第 3 个 见解 。 
RBS: 当 为 流量 类 型 或 流 之 间 提 供 隔离 时 ， 希望 尽 可 能 有 效 地 使 用 资源 (例如 链 路 
带宽 和 缓存 )。 
2. 调度 机 制 
在 1.3 节 和 4.2 节 我 们 曾经 讨论 过 ， 属 于 各 种 网 络 流 的 分 组 被 复 用 在 一 起 ， 并 且 在 与 
链 路 关联 的 输出 缓存 排队 等 竺 传输。 选择 在 链 路 上 传输 的 排队 分 组 的 方式 称 为 链 路 调度 规 
则 (link-scheduling discipline) ， 并 在 4.2 节 进 行 了 详细 讨论 。 回 想 在 4. 2 节 中 讨论 过 三 种 
链 路 调度 规则 ， 即 FIFO、 优 先 权 排队 和 加 权 公 平 队列 (WFQ)。 我 们 马上 将 看 到 WFO 对 
于 格力 流量 类 型 将 起 到 特别 重要 的 作用 。 
3. 监管 : 漏 桶 
我 们 前 面 的 见解 之 一 是 监管 ， 速 率 的 调节 是 一 种 重要 的 QoS 机 制 ， 以 该 速率 允许 一 类 
流量 或 流 〈 在 下 面 的 讨论 中 ， 我 们 将 假定 监管 的 单位 是 流 ) 向 网 络 注入 分 组 。 但 是 应 该 对 
一 个 流 的 分 组 速率 的 哪些 方面 进行 监管 呢 ? 我 们 能 够 指出 3 个 重要 的 监管 准则 ， 每 个 准则 
根据 被 监管 分 组 流 的 时 间 范 围 而 互 不 相同 : 
© 平均 速率 。 网 络 可 能 希望 限制 一 个 流 的 分 组 能 够 发 送 到 网 络 中 的 长 期 平均 速率 
(每 个 时 间 间 隔 的 分 组 数 ) 。 这 里 一 个 关键 的 问题 是 监管 平均 速率 的 时 间 间 隔 。 一 
个 平均 速率 被 限制 为 每 秒 100 个 分 组 的 流 要 比 一 个 每 分 钟 6000 个 分 组 的 源 受到 的 
约束 更 严格 ， 即 使 在 一 个 足够 长 的 时 间 间 隔 上 它们 有 相同 的 平均 速率 。 例 如 ， 后 
者 的 限制 允许 一 个 流 在 给 定 1 秒 长 的 时 间 间 隔 内 发 送 1000 个 分 组 ， 而 前 者 的 限制 
不 允许 这 种 发 送行 为 。 
e 峰值 速率 。 平均 速率 约束 限制 了 一 个 相对 长 的 时 间 内 能 够 发 送 到 网 络 中 的 流量 ， 
而 峰值 约束 限制 了 一 个 较 短 时 间 内 能 够 发 送 的 最 大 分 组 数 。 使 用 我 们 上 面 的 例子 ， 
网 络 能 以 每 分 钟 6000 个 分 组 的 平均 速率 来 监管 一 个 流 ， 但 是 限制 该 流 的 峰值 速率 
为 每 秒 1500 个 分 组 。 
© 突 发 长 度 。 网 络 也 许 还 希望 限制 极 短 的 时 间 间 隔 内 能 够 发 送 到 网 络 中 的 最 大 分 组 
数 〈 分 组 的 “ 突 发 (burst)”) 。 在 这 个 限制 中 ， 因 为 时 间 间 隔 长 度 趋 近 于 0， 该 突 
发 长 度 限制 了 能 够 瞬间 发 送 到 网 络 中 的 分 组 数量 。 尽 管 瞬间 发 送 多 个 分 组 到 网 络 
中 在 物理 上 是 不 可 能 的 (毕竟 每 条 链 路 都 有 一 个 无 法 超越 的 物理 传输 速率 !), 但 
对 最 大 突 发 长 度 的 抽象 也 是 有 用 的 。 
漏 桶 机 制 是 一 个 能 够 用 来 表征 这 些 监管 限制 的 抽象 。 如 图 9-14 所 示 ， 漏 桶 由 一 个 能 
够 容纳 5b 个 令 牌 的 桶 组 成 。 令 牌 加 进 该 桶 的 过 程 如 下 。 可 能 潜在 地 加 入 桶 中 的 新 令 牌 总 是 
以 每 秒 r 个 令 牌 的 速率 产生 。( 为 了 简单 化 起 见 ， 我们 这 里 假设 时 间 单 元 是 秒 。) 当 产 生 一 
个 令 牌 时 ， 如 果 桶 填充 得 少 于 5 个 令 牌 ， 新 产生 的 令 牌 加 入 到 该 桶 中 ; 否则 忽略 该 新 产生 
的 令 牌 ， 令 牌 桶 保持 具有 5。 个 令 牌 的 满 状态 。 
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图 9-14 漏 桶 监管 器 


现在 我 们 考虑 如 何 用 漏 桶 来 监管 分 组 流 。 假 设 在 一 个 分 组 向 网 络 传输 之 前 ， 必 须 首先 
从 令 牌 桶 中 去 除 一 个 令 牌 。 如 果 令 牌 桶 是 空 的 ， 分 组 必须 等 待 一 个 令 牌 。( 另 一 种 方法 是 
丢弃 该 分 组 ， 尽 管 我 们 这 里 不 讨论 这 种 选择 。) 现在 我 们 考虑 这 种 行为 是 如 何 监管 一 个 流 
量 流 的 。 因 为 在 桶 中 最 多 能 有 1 个 令 牌 ， 所 以 漏 桶 监管 的 流 的 最 大 突 发 长 度 是 个 分 组 。 
此 外 ， 因 为 令 牌 产生 速率 是 r， 所 以 在 任何 长 度 为 : 的 时 间 间 隔 内 能 够 进入 网 络 中 的 最 大 
分 组 数目 为 rt +b。 因 此 ， 令 牌 产 生 速 率 r 用 于 限制 分 组 能 够 进入 网 络 的 长 期 平均 速率 。 除 
了 监管 长 期 平均 速率 之 外 ， 使 用 漏 桶 具体 来 说 ， 串 联 的 两 个 漏 桶 ) 来 监管 流 的 峰值 速率 
也 是 有 可 能 的 ; 见 本 章 末 的 习题 。 

4. 漏 桶 + 加 权 公平 排队 = 队列 中 可 证 明 的 最 大 时 延 

我 们 关于 策略 的 最 后 讨论 是 说 明 如 何 将 调度 和 监管 两 种 机 制 结合 起 来 ， 以 提供 通过 路 
由 器 队列 的 时 延 界限 (鼓励 已 经 忘记 
WFQ 的 读者 复习 一 下 4.2 节 ) 。 我 们 考 id 
“RAT WFO 调度 的 路 由 器 ， 它 
的 输出 链 路 多 路 复 用 了 n 条 流 ， 其 中 每 
条 流 被 一 个 参数 为 5, 和 的 漏 桶 监管， 
i=1, =, no 这 里 我 们 使 用 的 术语 
“ 流 ” 大 致 是 指 不 能 被 调度 器 相互 区 别 
的 分 组 集合 。 实 践 中 ， 一 条 流 可 能 是 由 
单个 端 到 端 连 接 上 的 流量 或 者 许多 这 种 
连接 的 集合 流量 组 成 的 ， 参 见 图 9-15。 

我 们 前 面 讨论 WFQ 时 讲 过 ， 每 个 
流 ; 保证 收 到 至 少 等 于 R w Loy) 的 共享 链 路 带宽 ， 其 中 及 是 以 分 组 / 秒 为 单位 的 链 路 
传输 速率 。 当 以 WFQ 方式 等 待 服务 时 (也 就 是 通过 漏 桶 传递 之 后 ) ， 则 分 组 经 受 的 最 大 时 
延 是 什么 ? 我 们 来 关注 流 1。 假 设 流 1 的 令 牌 桶 最 初 是 满 的 。 然 后 b, 个 分 组 的 突 发 到 达 流 
1 的 漏 桶 监管 器 。 这 些 分 组 去 除了 漏 桶 中 所 有 的 令 牌 (没有 等 待 ) ， 然 后 加 入 了 流 1 的 
WFQ 等 待 区 域 。 因 为 这 4b 个 分 组 以 至 少 尺 . w/( Ew) 分 组 / 秒 的 速度 得 到 服务 ， 直 到 这 
些 分 组 的 最 后 一 个 传输 完成 ， 所 以 将 有 最 大 时 延 du， 其 中 
by 





图 9-15 采用 WFQ 调度 机 制 的 n 路 复 用 的 漏 桶 流 
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该 公式 的 基本 原理 是 ， 如 果 在 队列 中 有 b, 个 分 组 并 上 且 分 组 以 至 少 每 秒 Rw/( Dw, ) 
个 分 组 的 速率 从 队列 中 接受 服务 〈 被 去 除 ) ， 那 么 直到 最 后 一 个 分 组 的 最 后 一 个 比特 被 传送 ， 
时 间 量 不 会 超过 岂 /(R .zw ( 王 wj) )。 一 道 课 后 习题 请 你 证 明 ， 只 要 7 <R+w,/(Lw,), W 
du 确实 是 流 1 中 任何 分 组 在 WFQ 队列 中 要 经 受 的 最 大 时 延 。 


9. 5.3 区 分 服务 


在 学 习 了 提供 多 种 类 型 服务 的 动机 、 见 解 和 特定 的 机 制 后 ， 我 们 将 注意 力 集中 于 以 举 
例 方式 学 习 提 供 多 种 类 型 服务 的 方法 ， 即 因特网 区 分 服务 (Diffserv) 体系 结构 [RFC 
2475; Kilkki 1999 ] Diffserv 提供 服务 区 分 ， 也 就 是 在 因特网 中 以 一 种 可 扩展 性 方式 用 不 
同 的 方法 处 理 不 同类 型 流量 的 能 力 。 可 扩展 性 的 需求 来 源 于 这 样 的 事实 : 在 因特网 的 一 个 
主干 路 由 器 上 同时 存在 几 十 万 个 源 到 目的 地 的 并 行 流 。 我 们 很 快 将 看 到 ， 仅 仅 通过 在 网 络 
核心 放置 简单 的 功能 ， 而 在 网 络 的 “边缘 ”实现 更 复杂 的 控制 操作 ， 就 可 以 满足 该 需要 。 

我 们 从 图 9-16 中 显示 的 简单 网 络 开始 讨论 。 这 里 我 们 将 描述 Diffserv 的 一 种 可 能 用 
法 。 如 RFC 2475 中 所 描述 ， 其 他 的 变化 是 可 能 的 。 区 分 服务 体系 结构 由 两 个 功能 元 素 的 
集合 所 组 成 : 


© 边界 功能 : 分 组 分 类 和 流量 调节 。 在 网 络 的 人 边缘 〈 也 就 是 ， 或 者 在 产生 流量 的 - 


Diffserv 使 能 的 主机 ， 或 者 在 流量 经 过 的 第 一 个 Diffserv 使 能 的 路 由 器 ) ， 到 达 的 分 组 
被 标记 。 更 具体 地 说 ， 在 IPv4 或 者 IPv6 分 组 首部 中 的 区 分 服务 ( DS) 字段 被 设置 
为 某 个 值 [RFC 3260], I% DS 字段 的 定义 意欲 取代 我 们 在 第 4 章 中 讨论 的 IPv4 服务 
类 型 字段 和 IPv6 流量 类 型 字段 。 例 如 ， 在 图 9-16 H, MH 发 送 到 H3 的 分 组 可 能 
在 R1 被 标记 , 而 从 H2 发 送 到 H4 的 分 组 可 能 在 R2 被 标记 。 分 组 得 到 的 标记 标识 了 
该 分 组 所 属 的 流量 类 型 。 然 后 不 同类 型 的 流量 将 在 核心 网 络 得 到 不 同 的 服务 。 





图 例 : 
全 叶子 路 由 器 ”全 核心 路 由 器 
图 9-16 一 个 简单 的 Diffserv 网 络 例子 
© 核心 功能 : 转发 。 当 一 个 DS 标记 的 分 组 到 达 一 个 Diffserv 使 能 的 路 由 器 时 ， 根 据 
与 分 组 类 型 相关 的 所 谓 的 每 跳 行为 〈Per-Hop Behavior，PHB) ， 该 分 组 被 转发 到 它 


的 下 一 跳 。 每 跳 行为 影响 在 竞争 的 流量 类 型 之 间 共 享 路 由 器 缓存 和 链 路 带宽 的 方 
式 。Diffserv 体系 结构 的 一 个 关键 原则 是 路 由 器 的 每 跳 行 为 只 基于 分 组 标记 ， 即 分 
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组 所 属 的 流量 类 型 。 因 此 ， 如 果 图 9-16 中 从 HI 发 送 到 H3 的 分 组 和 从 H2 发 送 到 
H4 的 分 组 收 到 同样 的 标记 ， 网 络 路 由 器 则 将 这 些 分 组 处 理 为 一 个 聚合 体 ， 而 不 区 
别 这 些 分 组 是 源 于 Hl 还 是 源 于 H2。 例 如 ， 当 这 些 分 组 向 R4 转发 时 ，R3 不 区 分 
从 Hl 和 H2 产生 的 分 组 。 因 此 ，Diffserv 体系 结构 消除 了 为 各 个 “ 源 到 目的 地 ” 
对 而 保留 路 由 器 状态 的 要 求 ， 这 是 使 Diffserv 具有 可 扩展 性 的 一 个 重要 考虑 。 

这 里 有 一 个 类 比 可 能 有 助 于 理解 相关 概念 。 在 很 多 大 规模 的 社交 活动 中 〈 例 如 ， 一 场 大 
型 的 公众 招待 会 ， 一 场 大 型 的 跳舞 俱乐部 活动 或 者 迪斯科 有 舞会 ， 一 场 音乐 会 或 者 一 场 足 球 
赛 )， 参 加 活动 的 人 收 到 某 种 类 型 的 入 场 券 。 对 于 非常 重要 的 人 物 有 VIP 人 场 券 ; 对 于 21 岁 
或 者 年 龄 更 大 的 人 有 21 岁 以 上 的 人 场 券 (例如 是 否 可 以 享受 酒 类 饮料 ); 对 于 演唱 人 员 有 后 
BADGE; 对 于 记者 有 新 闻 人 场 券 ; 对 于 普通 人 有 普通 的 入 场 券 。 这 些 人 场 券 通常 在 该 活动 
的 入 口 分 发 ， 也 就 是 在 活动 的 边缘 进行 分 发 。 正 是 在 边缘 ， 进 行 着 计算 密集 型 操作 ， 例 如 交 
人 场 费 、 检 查 适合 的 邀请 类 型 以 及 对 照 检查 邀请 与 证 件 。 此 外 ， 对 于 允许 进入 一 个 活动 的 特 
定 类 型 的 人 数 可 能 有 限制 。 如 果 有 这 种 限制 ， 人 们 可 能 在 进入 活动 之 前 必须 等 待 。 一 旦 进入 
了 活动 ,一 个 人 的 人 场 券 使 他 在 活动 中 的 很 多 场所 接受 有 区 别 的 服务 ， 如 为 VIP 提供 免费 的 
饮料 、 较 好 的 桌子 、 免 费 食物 、 单 独 的 房间 和 括 勤 的 服务 。 与 之 相对 照 的 是 ， 一 个 普通 人 禁 
止 进入 某 些 区 域 ， 要 为 饮料 支付 费用 ， 并 且 只 受到 基本 服务 。 在 这 两 种 情况 下 ， 活 动 中 得 到 
的 服务 只 依赖 于 人 场 券 的 类 型 。 而 且 在 同一 类 型 的 所 有 人 得 到 相同 的 对 待 。 

图 9-17 提供 了 在 边缘 路 由 器 中 分 类 和 标记 功能 的 逻辑 视图 。 到 达 边 缘 路 由 器 的 分 组 
首先 被 分 类 。 分 类 器 根据 一 个 或 多 个 分 组 首部 字段 的 值 (例如 源 地 址 、 目 的 地 址 、 源 端 
口 、 目 的 端口 和 协议 ID) 来 选择 分 组 ， 并 引导 该 分 组 去 做 合适 的 标记 功能 。 如 前 面 所 指 
出 的 ， 分 组 的 标记 携带 在 分 组 首部 的 DS 字段 中 。 

在 某 些 情况 下 ， 端 用 户 可 能 已 经 同意 限制 其 分 组 发 送 速率 以 符合 某 个 申报 的 流量 配置 文 
件 (traffic profile) 。 该 流量 配置 文件 可 能 包含 对 峰值 速率 和 分 组 流 的 突 发 度 的 限制 ， 如 我 们 
_ 前面 在 漏 桶 机 制 中 所 见 。 只 要 用 户 以 符合 协商 的 流量 配置 文件 的 方式 向 网 络 中 发 送 分 组 ， 这 
些 分 组 就 会 得 到 它们 的 优先 级 标记 ， 并 沿 着 到 目的 地 的 路 径 转 发 。 另 一 方面 ， 如 果 违 反 了 该 
流量 配置 文件 ， 那 些 超出 流量 配置 文件 的 分 组 就 可 能 被 打上 不 同 的 标记 ， 或 被 整形 《例如 ， 
为 了 能 够 遵守 最 大 速率 限制 而 延 时 )， 
或 可 能 在 网 络 边 缘 被 丢弃 。 图 9-17 中 
所 示 的 测定 功能 (metering function ) 
的 作用 是 比较 进入 的 分 组 流 和 协商 的 
流量 配置 文件 ， 并 确定 某 分 组 是 否 在 
协商 的 流量 配置 文件 之 内 。 有 关 是 否 
立即 重新 标记 、 转 发 、 延 时 或 者 丢弃 
一 个 分 组 的 实际 决定 是 由 网 络 管理 员 
决定 的 策略 问题 ， 而 不 是 由 Diffserv 体 图 9-17 在 端 路 由 器 上 的 分 组 分 类 与 流量 调节 的 逻辑 视图 
系 结构 规定 的 。 

到 现在 为 止 ， 我 们 一 直 关注 着 Diffserv 体系 结构 中 的 标记 和 监管 功能 。Diffserv 体系 结 
构 的 第 二 个 关键 组 件 涉及 由 Diffserv 使 能 路 由 器 所 执行 的 每 跳 行 为 (PHB)。 该 每 跳 行为 有 
点 神秘 ， 但 被 仔细 地 定义 为 “Diffserv 节点 的 外 部 可 观察 的 转发 行为 的 描述 ， 该 节点 应 用 
了 一 个 特定 的 Diffserv FHRA” [RFC 2475 ] 。 稍 微 深 入 地 钻研 一 下 这 个 定义 ， 我 们 可 以 
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看 到 它 里 面包 含 的 几 个 重要 的 考虑 : 

。 PHB 能 够 导致 不 同 服务 类 型 的 流量 接收 到 不 同性 能 〈( 即 不 同 的 外 部 可 观察 的 转发 

行为 ) 。 

。 虽然 PHB 定义 了 在 各 种 类 型 之 间 的 性 能 (行为 ) 差别 ， 但 它 不 强求 为 了 获得 这 些 

行为 的 任何 特定 机 制 。 只 要 外 部 可 观察 的 性 能 准则 得 到 满足 ， 任 何 实现 机 制 和 任 
何 缓存 /带宽 分 配 策略 都 可 以 使 用 。 例 如 ， 一 个 PHB 将 不 要 求 使 用 一 个 特定 的 分 
组 排队 规则 (例如 优先 级 队列 、WFQ 队列 或 FCFS 队列 ) 以 取得 特定 的 行为 。 
PHB 是 最 后 的 结果 ， 资 源 分 配 和 实现 机 制 是 达到 PHB 的 手段 。 

。 性 能 的 差别 必须 是 可 观察 的 ， 因 而 是 可 测量 的 。 

已 经 定义 了 两 种 PHB: 一 种 是 加 速 转发 PHB [RFC 3246] ， 另 一 种 是 确保 转发 PHB 
[RFC 2597 ] 。 加 速 转发 Expedited Forwarding, EF) PHB 规定 了 一 类 流量 离开 路 由 器 的 
速率 必须 等 于 或 者 大 于 某 个 已 配置 的 速率 。 确 保 转发 (Assured Forwarding, AF) PHB 将 
流量 分 为 4 类 ， 其 中 每 个 AF 类 都 确保 提供 某 种 最 小 数量 的 带宽 和 缓存 。 

我 们 通过 对 Diffserv 的 服务 模型 进行 一 些 观察 来 结束 对 Diffserv 的 讨论 。 首 先 ， 我 们 隐 
含 地 假设 Diffserv 部 署 在 单个 管理 域 中 , 但 典型 情况 是 端 到 端的 服务 必须 在 跨越 通信 端 系 
统 之 间 的 多 个 ISP 来 形成 。 为 了 提供 端 到 端的 Diffserv 服务 ， 端 系统 之 间 的 所 有 ISP 不 仅 必 - 
须 提 供 这 种 服务 ， 而 且 为 了 向 端 用户 提 供 真正 的 端 到 端 服 务 ， 多 数 ISP 之 间 也 要 协作 并 做 
出 安排 。 如 果 没 有 这 种 协作 ， 直 接 向 客户 出 售 Diffserv 的 ISP 会 发 现 他 们 将 重复 地 说 :“ 是 
的 ， 我 们 知道 你 支付 了 额外 费用 ， 但 是 我 们 与 丢弃 和 延迟 你 流量 的 ISP 之 间 没 有 服务 约 
Eo RIRE VoIP 电话 中 有 很 多 间隙 !” 第 二 ， 如 果 Diffserv 实际 存在 并 且 该 网 络 
运行 的 负载 不 大 ， 大 多 数 时 间 尽 力 而 为 服务 和 Diffserv 服务 之 间 将 没有 可 觉察 的 差异 。 的 
确 ， 端 到 端 时 延 通常 是 由 接 人 速率 和 路 由 器 跳 数 造成 的 ， 而 不 是 由 路 由 器 中 的 排队 时 延 造 
成 的 。 想 象 一 个 支付 了 增值 服务 费用 的 不 幸 的 Diffserv 客户 ， 发 现 为 其 他 人 提供 的 尽力 而 
为 服务 几乎 总 是 具有 与 增值 服务 相同 的 性 能 ! 


9.5.4 每 连接 服务 质量 保证 : 资源 预约 和 呼叫 准 入 


在 前 一 节 中 ， 我们 已 经 看 到 了 分 组 标记 和 监管 、 流 量 隔 离 以 及 链 路 级 调度 能 够 为 一 类 
服务 提供 比 另 一 类 更 好 的 性 能 。 在 某 些 调度 规则 下 ， 如 优先 权 调 度 ， 较 低 类 型 的 流量 基本 
对 最 高 优先 权 类 型 的 流量 是 “不 可 见 ” 的 。 借 助 于 适当 的 网 络 定制 ， 最 高 类 型 的 服务 的 确 
能 够 取得 极 低 的 丢 包 和 时 延 ， 即 基本 上 是 
类 似 于 电路 的 性 能 。 但是， 这 种 网 络 能 够 
确保 一 个 在 高 优先 权 流 量 类 型 中 的 进行 
流 ， 仅 使 用 我 们 已 经 描述 的 这 些 机 制 就 能 
在 整个 流 期 间 持续 得 到 这 样 的 服务 吗 ? 答 
案 是 否定 的 。 在 本 节 中 ,我 们 将 看 到 当 对 
各 个 连接 提供 硬 服务 保证 时 ， 为 什么 还 需 
要 另外 的 网 络 机 制 和 协议 。 

我 们 返回 9. 5. 2 节 的 场景 中 ， 考 虑 两 VE E 
4s 1Mbps 的 音频 应 用 经 1.5Mbps Hg H2 H4 
传输 它们 的 分 组 ， 如 图 9-18 所 示 。 这 两 ”图 9-18 两 个 竞争 的 音频 应 用 过 载 R1 到 R2 的 链 路 
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条 流 的 结合 数据 率 (2Mbps) 超过 了 这 条 链 路 的 容量 。 即 使 使 用 分 类 和 标记 、 流 量 隔离 以 

及 共享 未 使 用 的 带宽 (这 里 并 没有 未 使 用 的 带宽 ) ， 这 很 明显 还 是 一 个 与 丢 包 有 关 的 命题 。 

只 是 因为 没有 足够 的 带宽 同时 满足 两 个 应 用 的 需求 。 如 果 这 两 个 应 用 平等 地 共享 该 带宽 ， 

每 个 应 用 将 会 丢失 其 25% 的 传输 分 组 。 这 是 一 个 无 法 接受 的 低 Qo5， 以 至 于 两 个 音频 应 用 

完全 不 可 用 ; 甚至 从 一 开始 就 没有 必要 传输 任何 音频 分 组 。 

在 图 9-18 中 两 个 应 用 不 能 同时 满足 的 情况 下 ， 这 个 网 络 应 当做 些 什么 呢 ? 如 果 人 允许 
两 者 以 一 种 不 可 用 的 QoS 继续 在 应 用 流 上 浪费 网 络 资源 ， 最 终 将 无 法 向 端 用 户 提供 任何 效 
Ho 希望 该 答案 是 清晰 的 ， 即 应 用 流 中 的 一 个 应 当 被 阻塞 ( 即 拒绝 接 入 网 络 ) ， 而 另 一 个 
应 当 人 允许 继续 进行 ， 使 该 应 用 使 用 所 需 的 全 部 1Mbps。 电 话 网 是 一 个 执行 这 种 呼叫 阻塞 的 
网 络 例子 ， 即 如 果 要 求 的 资源 (在 电话 网 的 情况 下 是 一 个 端 到 端的 电路 ) 不 能 分 配给 该 呼 
叫 ， 该 呼叫 就 被 阻塞 了 (阻止 进入 网 络 ) ， 并 且 返 回 给 用 户 一 个 忙 信号 。 在 我 们 的 例子 中 ， 
如 果 一 个 流 没 有 分 配 到 足够 的 QoS 来 使 自己 可 用 ， 人 允许 它 进 入 网 络 没 有 任何 好 处 。 的 确 ， 
接纳 一 个 不 能 得 到 它 需 要 的 QoS 的 流 是 要 付出 代价 的 ， 因 为 网 络 资源 被 用 于 支持 一 个 对 端 
用 户 没 有 用 的 流 。 

通过 基于 流 的 资源 要 求 以 及 已 经 准 入 流 的 资源 要 求 明 确 地 准 和 或 阻塞 流 ， 网 络 能 够 保 
证 准 入 流 可 得 到 它们 所 请 求 的 Qo5。 这 隐 含 的 意思 是 : 需要 为 流 提 供 有 保证 的 QoS 就 需要 
流 来 申告 它 的 QoS 需求 。 让 流 申告 它 的 QoS 需求 ， 然 后 让 网 络 接受 该 流 (以 所 要 求 的 
QoS) 或 者 阻塞 该 流 的 过 程 称 为 呼叫 准 入 (call admission) 过 程 。 这 则 是 我 们 的 第 4 TH 
解 ( 除 了 前 面 9.5.2 节 中 的 3 个 见解 外 ) ， 该 见解 增加 了 提供 QoS 所 需 的 机 制 。 

见解 4: 如 果 不 总 是 能 够 提供 充分 的 资源 ， 并 且 要 确保 Qo05， 则 需要 一 个 呼叫 准 入 过 
程 ， 在 这 个 过 程 中 流 申告 其 QoS 需求 ， 然 后 要 么 被 网 络 准 入 (以 所 要 求 的 Qo5) ， 要 么 被 
网 络 阻塞 ( 如果 网 络 不 能 提供 所 要 求 的 QoS). 

如 果 一 个 呼叫 (一 个 端 到 端 流 ) 一 旦 开始 就 要 被 确保 给 定 的 服务 质量 ， 则 我 们 在 

图 9-18 中 的 促进 思考 的 例子 强调 了 对 几 种 新 的 网 络 机制 和 协议 的 需求 : 

i 。 资源 预 留 。 为 了 满足 一 个 呼叫 所 希望 的 Qo5， 确 保 它 具有 所 需 的 资源 ( 链 路 带宽 、 
缓存 ) 的 唯一 方法 是 显 式 地 为 该 呼叫 分 配 这 些 资源 ， 用 网 络 的 行 话 来 讲 ， 该 过 程 
称 为 资源 预 留 (resource reservation) 。 一 旦 呼叫 预约 了 资源 ， 它 在 其 整个 过 程 中 按 
需 访问 这 些 资 源 ， 而 不 管 所 有 其 他 呼叫 的 需求 。 如 果 一 个 呼叫 预约 并 得 到 链 路 带 
宽 的 x*Mbps 的 保证 ， 而 且 传 输 速 率 决 不 会 大 于 x Mbps， 则 该 呼叫 将 具有 无 丢 包 和 
无 时 延 的 性 能 。 

e 呼叫 准 入 。 如 果 预 留 了 资源 ， 则 该 网 络 必须 具有 一 种 用 于 呼叫 请 求 和 预 留 资源 的 
机 制 。 由 于 资源 不 是 无 限 的 ， 如 果 请 求 的 资源 不 可 用 ， 则 进行 呼叫 准 入 请 求 的 呼 
叫 将 被 拒绝 准 入 ， 即 被 阻塞 。 电 话 网 执行 的 是 这 种 呼叫 准 和 人 机制 ， 即 当 我 们 拨 一 
个 号 码 时 ， 就 请 求 了 资源 。 如 果 完 成 该 呼叫 所 需 的 电路 (TDMA AY BR) 是 可 用 的 ， 
则 分 配 电路 并 且 完 成 了 呼叫 。 如 果 电 路 不 可 用 ， 则 该 呼叫 被 阻塞 ， 我 们 得 到 了 忙 
信号 。 为 了 得 到 网 络 的 准 入 ， 被 阻塞 的 呼叫 能 够 一 再 尝试 ， 但 是 直到 它 成 功 地 完 
成 呼叫 准 人 过 程 ， 才 被 允许 向 网 络 发 送 流量 。 当 然 ， 分 配 链 路 带宽 的 路 由 器 ， 其 
分 配 的 带宽 不 应 当 超 过 链 路 可 用 的 带宽 。 通 常 ， 一 个 呼叫 仅 能 预约 一 条 链 路 的 带 
宽 的 一 部 分 ， 因 此 一 台 路 由 器 可 以 为 多 于 一 条 呼叫 分 配 链 路 带宽 。 然 而 ， 如 果 要 
提供 硬 服务 质量 保证 的 话 ， 为 所 有 呼叫 分 配 的 带宽 总 和 应 当 小 于 该 链 路 的 容量 。 

e 呼叫 建立 信 令 。 以 上 描述 的 呼叫 准 入 过 程 要 求 一 条 呼叫 沿 着 它 的 源 到 目的 地 路 径 


472 OF 





在 每 台 网 络 路 由 器 中 能 够 预约 充足 的 资源 ， 以 确保 满足 它 的 端 到 端 QoS OK, 
台 路 由 器 必须 决定 会 话 所 请 求 的 本 地 资源 ， 考 虑 已 经 承诺 给 其 他 进行 中 的 会 话 的 
资源 量 ， 并 决定 它 是 否 有 足够 的 资源 来 满足 在 这 人 台 路 由 器 上 的 该 会 话 的 每 跳 QoS 
要 求 ， 而 不 违反 对 所 有 已 经 准 入 的 会 话 做 出 的 本 地 QoS 保证 。 需 要 一 个 信 令 协议 
来 协调 这 些 各 种 各 样 的 活动 ， 即 本 地 资源 的 每 跳 分 配 ， 以 及 该 呼叫 是 否 能 够 在 沿 
着 端 到 端 路 径 上 的 每 台 路 由 器 中 预约 充分 的 资源 。 这 是 如 图 9-19 所 示 的 呼叫 建立 
协议 (call setup protocol) 的 任务 。 资 源 预 留 协 议 (resource ReSerVation Protocol, 
RSVP) [Zhang 1993, RFC 2210] 就 是 在 因特网 体系 结构 中 为 此 目的 所 提出 的 ， 
用 于 提供 服务 质量 保证 。 在 ATM 网 络 中 ，Q2931b 协议 [Black 1995] 在 ATM 网 
络 的 交换 机 和 端点 之 间 承 载 了 这 种 信息 。 

QoS 呼叫 信 令 建立 





图 9-19 呼叫 建立 过 程 


尽管 投入 了 巨大 的 研究 和 开发 力量 ， 并 且 甚 至 开发 出 了 提供 每 连接 服务 质量 保证 的 产 
品 ， 但 是 几乎 没有 这 种 服务 的 扩展 部 署 。 有 许多 可 能 的 原因 。 首 当 其 冲 的 是 ， 情 况 很 可 能 
是 我 们 在 9. 2 ~9. 4 节 学 习 的 简单 的 应 用 级 机 制 与 适当 的 网 络 定制 相 结合 (9. 5. 1 节 ) ， 为 
多 媒体 应 用 提供 了 “足够 好 的 ”尽力 而 为 的 网 络 服务 。 此 外 ，ISP 判断 : 提供 每 连接 服务 
质量 保证 所 需 的 附加 复杂 性 以 及 部 署 和 管理 网 络 的 成 本 ， 相 对 于 该 服务 可 预测 的 用 户 收 
和 人 和， 前 者 可 能 过 高 。 


9.6 小 结 


多 媒体 网 络 是 当今 因特网 中 最 为 激动 人 心 的 发 展 之 一 。 全 世界 的 人 们 在 收音 机 和 电视 
机 面前 花费 的 时 间 越 来 越 少 ， 而 转向 使 用 他 们 的 智能 手机 和 设备 接收 音频 和 视频 传输 ， 它 
们 包含 了 实况 转播 和 预先 录制 的 节目 。 此 外 ， 借 助 于 如 YouTube 这 样 的 网 站 ， 用 户 除了 是 
多 媒体 因特网 内 容 的 消费 者 ， 也 成 为 内 容 的 生产 者 。 除 了 视频 分 发 ， 因 特 网 也 正在 用 于 传 
输电 话 。 事 实 上 ， 经 过 下 一 个 10 年 ， 因 特 网 连同 无 线 因 特 网 接 人 ， 可 能 致使 传统 的 电路 
交换 电话 系统 成 为 明日 黄花 。VolP 不 仅 提供 了 廉价 的 电话 服务 ， 而 且 将 提供 大 量 的 增值 
服务 ， 例 如 视频 会 议 、 在 线 目 录 服 务 、 语 音 消 息 及 融 人 如 脸 书 和 微 信 等 社交 网 络 。 

在 9.1 节 中 ,我 们 描述 了 视频 和 语音 的 内 在 特点 ， 将 多 媒体 应 用 分 为 3 种 类 型 : 
(i) 流 式 存储 音频 /视频 ; Gi) 会 话 式 IP 语音/ 视频; Gii) 流 式 实况 音频 /视频 。 
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在 9.2 节 中 ,我 们 更 为 深入 地 学 习 了 流 式 存储 视频 。 对 于 流 式 视频 应 用 ， 预 先 录 制 的 
视频 放置 在 服务 器 上 ， 用 户 向 这 些 服 务 器 发 送 请 求 以 按 需 观 看 这 些 视频 。 我 们 看 到 流 式 视 
频 系统 能 够 被 分 为 两 种 类 型 : UDP 流 和 HTTP 流 。 我 们 观察 到 对 于 流 式 视频 的 最 为 重要 的 
性 能 测量 是 平均 吞吐 量 。 

在 9.3 节 中 ， 我们 研究 了 诸如 VoIP 等 会 话 式 多 媒体 应 用 能 够 设计 运行 在 尽力 而 为 网 
络 上 的 方法 。 对 于 会 话 式 多 媒体 ， 定 时 考虑 是 重要 的 ， 因 为 会 话 式 应 用 是 高 度 时 延 敏 感 
的 。 在 另 一 方面 ， 会 话 式 多 媒体 应 用 是 容忍 丢 包 的 ， 即 偶尔 的 丢 包 仅 会 在 音频 /视频 播放 
中 引起 偶尔 的 干扰 信号 ， 并 且 这 些 丢 包 常 常 能 被 部 分 地 或 者 全 部 地 掩盖 。 我 们 看 到 将 客户 
缓存 、 分 组 序号 和 时 间 戳 结合 起 来 的 方法 ， 极 大 地 缓解 了 网 络 引 入 的 时 延 抖 动 的 影响 。 我 
们 也 展望 了 Skype 所 依赖 的 技术 ，Skype 是 下 语音 和 卫视 频 界 的 领头 公司 之 一 。 在 9.4 节 
中 ， 我 们 学 习 了 两 种 最 为 重要 的 用 于 VoIP 的 标准 化 协议 ， 即 RTP 和 SIP. 

在 9.5 节 中 ,我们 介绍 了 几 种 网 络 机 制 ( 链 路 级 调度 规则 和 流量 监管 ) 是 如 何 用 于 在 
几 类 流量 之 间 提 供 区 分 服务 的 。 


课 后 习题 和 问题 


复习 题 


9.19% 

R1. 针对 Victor Video 正在 观看 4Mbps 视频 ，Facebook Frank 每 20 秒 观 看 一 幅 新 的 100KB 图 片 ， 以 及 Mar- 
tha Music 正在 听 200kbps 音频 流 的 情况 ， 重 新 构造 9-1 表 。 

R2. 在 视频 中 有 两 种 类 型 的 元 余 。 描 述 它 们 ， 并 讨论 如 何 能 够 利用 它们 进行 有 效 压 缩 。 

R3. 假定 一 个 模拟 音频 信号 每 秒 抽样 16 000 次 ， 并 且 每 个 样本 量化 为 1024 级 之 一 ， 该 PCM 数字 音频 信 
号 的 比特 率 将 是 多 少 ? 

R4. 多 媒体 应 用 能 够 分 为 三 种 类 型 。 阐 述 它们 的 名 称 并 对 每 种 类 型 进行 描述 。 

-9.2% 

RS. 流 式 多 媒体 系统 能 够 分 为 三 种 类 型 。 曾 述 它们 的 名 称 并 对 每 种 类 型 进行 描述 。 

R6. 列举 UDP 流 的 三 种 缺点 。 

R7. 对 于 HTTP i, TCP 接收 缓存 和 客户 应 用 缓存 是 相同 的 东西 吗 ? 如 果 不 是 ， 它 们 是 怎样 交互 的 呢 ? 

R8. 考虑 对 于 HTTP 流 的 简单 模型 。 假 设 服务 器 以 2Mbps 的 恒定 速率 发 送 比特 ， 并 且 当 已 经 接收 到 800 
万 比特 时 开始 播放 。 初 始 缓 存 时 延 t, 是 多 少 ? 

9.3 节 

R9. 端 到 端 时 延 和 分 组 时 延 拌 动 的 区 别 是 什么 ? 分 组 时 延 拌 动 的 原因 是 什么 ? 

R10. 为 什么 在 预定 的 播放 时 间 之 后 收 到 的 分 组 被 认为 是 丢失 了 ? 

R11. 9.3 节 描 述 了 两 种 FEC 方案 ， 简 要 地 总 结 它们 。 这 两 种 方案 通过 增加 开销 而 增加 了 流 的 传输 速率 。 
交织 技术 也 会 增加 传输 速率 吗 ? 

9.4 节 

R12. 接收 方 如 何 识别 在 不 同 会 话 中 的 不 同 RTP 流 ? 同一 个 会 话 中 的 不 同 流 是 怎样 识别 的 ? 

R13. SIP 注册 器 的 作用 是 什么 ? 一 个 SIP 注册 器 的 作用 与 移动 IP 中 的 归属 代理 的 作用 有 怎样 的 差异 ? 


We 


Pl. 考虑 下 图 。 类 似 于 我 们 对 图 9-1 的 讨论 ， 假 设 视频 以 固定 比特 率 进行 编码 ， 因 此 每 个 视频 块 包含 了 
在 相同 的 固定 时 间 量 A 播放 的 视频 帧 。 服 务 器 在 ty 时 刻 传输 第 一 个 视频 块 ， 在 t。+ A 时 刻 传输 第 二 
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块 ， 在 如 +2A 时 刻 传输 第 三 块 ， 等 等 。 一 旦 客户 开始 播放 ， 每 个 块 应 当 在 前 一 块 后 播放 A 时 间 

单元 。 

a 假设 第 一 块 在 t, 时刻 一 到 达 ， 客 户 就 开始 播放 。 在 下 图 中 ， 多 少 视频 块 (包括 第 一 块 ) 将 及 时 到 
达 客 户 供 其 播放 ? 解释 你 怎样 得 到 该 答案 的 。 

b. 假设 该 客户 现在 在 + A 时 刻 开始 播放 。 多 少 视频 块 (包括 第 一 块 ) 将 及 时 到 达 客 户 供 其 播放 ? 
解释 你 怎样 得 到 该 答案 的 。 

c. 在 如 上 面 (b) 的 相同 场景 中 ， 存 储 在 客户 缓存 中 等 待 播放 的 块 的 最 大 数量 有 多 少 ? 解释 你 怎样 
得 到 该 答案 的 。 

d 在 客户 中 为 使 每 个 视频 块 及 时 到 达 供 其 播放 ，' 最 小 的 播放 时 延 是 多 少 ? 解释 你 怎样 得 到 该 答案 的 。 


视频 块 编号 
-NURA ~1000 





时 间 


. 回想 在 图 9-3 中 显示 的 HTTP 流 的 简单 模型 。 前 面 讲 过 B 表示 客户 应 用 缓存 的 长 度 ，Q 表示 在 客户 应 
用 缓存 开始 播放 之 前 必须 被 缓存 的 比特 数量 。 还 有 7 表示 视频 消耗 速率 。 假 设 无 论 何 时 客户 缓存 不 
满 ， 服 务 器 都 以 恒定 速率 x 发送 比特 。 

a 假设 x<r。 如 在 本 书 所 讨论 ， 在 此 场合 播放 将 在 连续 播放 期 和 停滞 期 之 间 变 动 。 作 为 0、r 和 > 的 
函数 ， 确 定 每 个 连续 播放 和 停滞 期 的 长 度 。 
b. 现在 假设 * >r。 求 客户 应 用 缓存 变 满 的 时 刻 t =t? 

,回想 在 图 9-3 中 显示 的 HTTP 流 的 简单 模型 。 假 设 缓 存 长 度 是 有 限 的 ， 并 服务 器 以 可 变 的 速率 x(t) 
发 送 比特 。 具 体 而 言 ， 假 设 x(t) 具有 下 列 锯齿 形状 。 其 速率 在 时 刻 1=0 初始 为 零 ， 在 时 刻 上 = 了 线 
性 仆 升 到 五 。 然 后 反复 重复 这 种 模式 ， 如 下 图 中 显示 的 那样 。 

a 服务 器 的 平均 发 送 速率 是 什么 ? 

b. 假设 Q =0， 客 户 一 接收 到 一 个 视频 块 就 开始 播放 。 将 发 生 什么 现象 ? 

co 现在 假设 Q>0。 作 为 Q、 瑟 和 7 的 函数 ， 确 定 首先 开始 播放 的 时 间 。 

d. 假设 五 >2r Al Q=HT/2, 证 明 在 初始 播放 时 延 之 后 将 不 会 有 停滞 。 

e 假设 五 >2r。 求 出 最 小 的 0 值 ， 使 在 初始 播放 时 延 之 后 将 不 会 有 停滞 。 

f 现在 假定 缓存 长 度 B 是 有 限 的 。 假 定 吾 >2r。 作 为 GQ、B、T 和 所 的 函数 ， 确 定 当 客 户 应 用 缓存 首 
次 变 满 的 时 刻 t= tjo 


比特 率 x(?) 


P4. 


gg 
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回想 在 图 9-3 中 显示 的 HTTP 流 的 简单 模型 。 假 设 客户 应 用 缓存 长 度 是 有 限 的 ， 服 务 器 以 恒定 的 速率 
x 发 送 ， 并 且 视 频 的 压缩 率 是 >， 其 中 r<x。 还 假设 播放 立即 开始 。 假 设 用 户 早 在 时 刻 ! = 五 中 止 视 
频 。 在 中 止 的 时 刻 ， 服 务 器 停止 发 送 比特 〈 如 果 它 还 没有 发 送 视频 中 所 有 比特 的 话 ) o 

a 假设 视频 为 有 限 长 。 问 浪费 了 多 少 比特 〈 即 发 送 但 未 观看 )? 

b 假设 视频 为 了 秒 长 ， 其 中 了 >。 问 浪费 了 多 少 比特 〈 即 发 送 但 未 观看 )? 


. 考虑 一 个 DASH 系统 ， 其 中 有 Y 个 视频 版 本 (及 种 不 同 的 速率 和 质量 ) 和 NN 种 音频 版 本 (有 NN 种 


不 同 的 速率 和 质量 ) 。 假 设 我 们 要 允许 播放 者 在 任何 时 间 对 任何 N 种 视频 版 本 和 任何 N 种 音频 版 本 

进行 选择 。 

a 如 果 我 们 生成 文件 ， 使 音频 与 视频 混合 起 来 ， 这 样 服务 器 在 给 定 的 时 间 仅 发 送 一 种 媒体 流 ， 该 服 
务 器 将 需要 存储 多 少 文件 〈 每 个 文件 有 一 种 不 同 的 URL)? 

b. 如 果 服 务 器 单独 发 送 音频 流 和 视频 流 并 且 让 客户 同步 这 些 流 的 话 ， 该 服务 器 将 需要 存储 多 少 文件 ? 


. 在 9.3 节 的 VoIP 例子 中 ,， 令 为 加 到 每 个 块 中 的 首部 字 节 总 数 ， 包 括 UDP A IP 的 首部 。 


a. 假设 每 20 秒 发 射 一 个 正 数据 报 ， 求 出 由 该 应 用 一 侧 产生 的 数据 报 的 每 秒 传输 速率 (以 比特 计 ) 。 
b. 当 使 用 RTP AY, h 的 典型 值 是 什么 ? 


-考虑 在 9.3 节 中 描述 估计 平均 时 延 di 的 过 程 。 假 设 w=0.1。 令 7 -i 是 最 近 的 采样 时 延 ， 令 r -t 


是 下 一 个 最 近 的 采样 时 延 ， 等 等 。 

a 对 于 一 个 特定 的 音频 应 用 ,假设 四 个 分 组 到 达 接 收 方 的 采样 时 延 为 rs - ty. 一、Ts 一 Mr, - 
tho 根据 这 4 个 采样 来 表示 时 延 d 的 估计 值 。 

b. 对 于 nn 个 采样 时 延 归纳 出 公式 。 

c 对 于 b 小 题 的 公式 ， 令 n 趋 于 无 穷 ， 给 出 最 后 的 公式 。 评 论 一 下 为 什么 这 个 平均 过 程 被 称 为 一 个 
指数 移动 平均 数 。 


. 重复 习题 P7 PAY (a) 和 〈b) ， 求 出 平均 时 延 偏差 的 估计 值 。 
. 对 于 9.3 节 中 的 VoIP 例子 ， 我 们 引入 了 一 个 估计 时 延 的 在 线 过 程 (指数 移动 平均 数 ) 。 在 本 习题 中 


我 们 将 研究 另 一 种 过 程 。 设 点 是 接收 到 的 第 i 个 分 组 的 时 间 蕉 ; Ber, 是 收 到 第 i 个 分 组 的 时 间 。 令 d, 

表示 在 收 到 第 个 分 组 后 我 们 对 平均 时 延 的 估计 。 在 收 到 第 一 个 分 组 后 ,我 们 设置 时 延 估计 值 等 于 

di =r, -tio 

a 假设 我 们 希望 对 于 所 有 的 n, 有 =(7, Shy FI Hh Pi PF, -t,) /no 根据 des Ta Alt, , 给 出 
d, 的 递归 公式 。 

b. 描述 一 下 对 于 VoIP， 为 什么 在 9.3 节 中 描述 的 时 延 估 计 比 (a) 部 分 叙述 的 时 延 估 计 更 合适 。 


P10. 比较 9. 3 节 描 述 的 估计 平均 时 延 的 过 程 和 3. 5 节 估 计 往 返 时 间 的 过 程 。 这 些 过 程 有 什么 相同 ? 有 什 


么 不 同 ? 


PIL. 考虑 下 图 ( 它 类 似 于 图 9-3) 。 某 发 送 方 在 1= 1 时 开始 周期 性 地 发 送 分 组 化 的 音频 。 在 上 =8， 第 一 


个 分 组 到 达 接 收 方 。 


生成 的 分 组 


分 组 


收 到 的 分 组 一 


1 8 
时 间 


a 分 组 2 到 分 组 8 的 时 延 (从 发 送 方 到 接收 方 ， 忽 略 任何 播放 时 延 ) 是 什么 ? 注意 到 在 该 图 上 每 个 
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P12. 


P13. 


P14. 


P15. 


P16. 


P17. 





垂直 和 水 平 线段 具有 1、2 或 3 个 时 间 单 元 的 长 度 。 

b. 如 果 第 一 个 分 组 在 上 =8 时 刻 一 到 达 接 收 方 ， 音 频 就 开始 播放 ， 发 送 的 前 8 个 分 组 中 的 哪些 将 不 
能 按时 到 达 进 行 播放 ? 

c 如 果 在 上 =9 时 刻 音频 开始 播放 ， 发 送 的 前 8 个 分 组 中 的 哪些 将 不 能 按时 到 达 进 行 播放 ? 

d. 在 接收 方 ， 导 致 所 有 前 8 个 分 组 按时 到 达 进 行 播放 的 最 小 播放 时 延 是 什么 ? 

再 次 考虑 习题 P11 中 的 图 ， 显 示 分 组 音频 传输 和 接收 时 间 。 

a. 计算 分 组 2 到 分 组 8 的 估计 时 延 ， 使 用 9. 3.2 节 中 的 对 于 d 的 公式 。 使 用 =0. 1 的 值 。 

b. 使 用 9. 3.2 节 中 对 于 vw 的 公式 ， 从 对 分 组 2 到 分 组 8 的 估计 平均 时 延 计算 其 估计 的 偏差 。 

在 9.3 节 中 讲 过 VoIP 的 两 种 FEC 方案 。 假 设 第 一 种 方案 为 每 4 个 初始 块 产生 一 个 元 余 块 。 假 设 第 

二 种 方案 使 用 传输 速率 为 标 称 流传 输 速 率 的 25% 的 低 比特 率 编码 。 

a 每 种 方案 需要 多 少 额 外 带宽 ? 每 种 方案 增加 多 少 播放 时 延 ? 

b. 如 果 在 每 组 的 5 个 分 组 中 第 一 个 分 组 丢失 了 ， 这 两 种 方案 如 何 执行 ? 哪 一 种 方案 有 更 好 的 音频 
质量 ? 

e 如 果 在 每 组 的 2 个 分 组 中 第 一 个 分 组 丢失 了 ， 这 两 种 方案 如 何 执 行 ? 哪 一 种 方案 有 更 好 的 音频 
质量 ? 

a. 考虑 Skype 中 的 一 个 音频 会 议 具 有 NN >2 个 与 会 者 。 假 定 每 个 与 会 者 生成 一 个 速率 rbps 的 恒定 流 。 
呼叫 的 发 起 方 将 需要 每 秒 发 送 多 少 比特 ? 其 他 — !1 个 与 会 者 每 个 都 将 需要 每 秒 发 送 多 少 比特 ? 
聚合 所 有 与 会 者 ， 总 的 发 送 速率 是 多 少 ? 

b. 对 于 使 用 一 台中 心服 务 器 的 一 个 Skype 视频 会 议 ， 重 复 (a), 

c. 重复 (b)， 只 是 现在 情况 为 每 个 对 等 方 发 送 其 视频 流 副本 到 其 他 NN 一 1 个 对 等 方 。 

a. 假设 我 们 向 因特网 发 送 两 个 卫 数据 报 ， 每 个 数据 报 携带 不 同 的 UDP 段 。 第 一 个 数据 报 的 源 卫 地 
址 为 Al， 目 的 卫 地址 为 B， 源 端口 为 PL， 目 的 端口 为 T。 第 二 个 数据 报 的 源 卫 地址 为 A2， 目 的 
IP 地 址 为 B， 源 端口 为 P2， 目 的 端口 为 T。 假 设 Al 和 A2 不 同 ，P1 和 也 不同。 假设 这 两 个 数据 
报 都 到 达 它 们 的 目的 地 址 ， 这 两 个 UDP 数据 报 会 被 同一 个 套 接 字 接 收 吗 ? 为 什么 ? 

b. 假设 Alice, Bob 和 Claire 要 使 用 SIP 和 RTP 来 进行 音频 会 议 呼 叫 。Alice 与 Bob 和 Claire 之 间 发 送 
和 接收 RTP 分 组 ， 只 有 一 个 UDP 套 接 字 足 够 吗 (SIP 报 文 所 需 的 套 接 字 除外 )? WRB, WA 
Alice 的 SIP 客户 如 何 区 分 RTP 分 组 是 来 自 Bob 还 是 来 自 Claire? 

是 非 判 断 题 : 

a. 如 果 存 储 视频 直接 从 Web 服务 器 流 式 传输 到 媒体 播放 器 ， 这 个 应 用 则 正在 使 用 TCP 作为 底层 的 
传输 协议 。 

b. 当 使 用 RTP 时 ， 发 送 方 有 可 能 在 会 话 的 中 间 改 变 编 码 。 

c. 所 有 使 用 RTP 的 应 用 必须 使 用 端口 87。 

d 假设 一 个 RTP 会 话 对 每 个 发 送 方 有 独立 的 音频 和 视频 流 ， 则 这 些 音频 和 视频 流 使 用 同样 的 SSRC。 

e 在 区 分 服务 中 ， 尽 管 每 跳 行为 定义 了 各 类 型 之 间 的 性 能 差别 ， 但 它 没有 强制 要 求 为 了 获得 这 些 性 
能 而 使 用 任何 特定 机 制 。 

f 假设 Alice 要 和 Bob 建立 一 个 SIP 会 话 。 在 她 的 INVITE 报 文 中 包括 了 这 样 的 行 : m = audio 48753 
RTP/AVP 3 (AVP 3 指示 GSM 音频 ) 。 因 此 Alice 在 该 报 文中 指示 她 要 发 送 CSM 音频 。 

g 参考 前 一 句 说 法 ，Alice 在 她 的 INVITE 报 文中 指示 了 她 将 把 音频 发 送 到 端口 48753。 

h. SIP 报 文 在 SIP 实体 之 间 通 常 使 用 一 个 默认 的 SIP 端口 号 发 送 。 

i 为 了 维护 注册 ，SIP 客户 必须 周期 地 发 送 REGISTER 报 文 。 

j SIP 强制 所 有 的 SIP 客户 支持 G. 711 音频 编码 。 

考虑 下 图 ， 图 中 显示 了 一 个 由 分 组 流 提 供 输入 的 漏 桶 监管 器 。 令 牌 桶 能 够 保持 最 多 两 个 令 牌 ， 并 最 

初 在 1=0 时 刻 是 满 的 。 新 的 令 牌 以 每 时 际 1 个 令 牌 的 速率 到 达 。 输 出 链 路 速率 采用 下 列 规则 : 如 果 

两 个 分 组 在 一 个 时 隙 的 开始 获得 令 牌 ， 它 们 能 够 在 相同 的 时 隙 中 进入 输出 链 路 。 该 系统 的 定时 细节 

如 下 : 
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“| 二 1 令 牌 时 隙 
b=2 令 牌 


分 组 队列 
SESH 

1 分 组 在 时 阶 的 开始 到 达 (如 果 有 的 话 ) 。 因 此 在 该 图 中 ， 分 组 1、2 和 3 在 时 阶 0 到 达 。 如 果 在 队 
列 中 已 经 有 分 组 ， 则 到 达 的 分 组 加 入 该 队列 的 尾部 。 分 组 以 FIFO 方式 朝 着 该 队列 的 前 方 行进 。 

2. 当 到 达 分 组 增加 进 队列 之 后 ， 如 果 有 任何 排队 分 组 ， 那 些 分 组 中 的 一 个 或 两 个 (取决 于 可 用 令 牌 
的 数量 ) 将 每 个 从 令 牌 柄 中 去 除 一 个 令 牌 并 在 那个 时 阶 去 往 输出 链 路 。 因 此 ， 分 组 1 和 2 从 栖 
中 去 除 一 个 令 牌 《因为 最 初 有 两 个 令 牌 ) 并 在 时 隙 0 期 间 去 往 输出 链 路 。 

3. 如 果 令 牌 本 未 满 则 新 令 牌 加 入 ， 因 为 令 牌 产生 速率 是 = 1 令 牌 /时 阶 。 

4. 然后 时 间 前 进 到 下 一 个 时 阶 ， 并 且 重复 这 些 步 怠 。 

回答 下 列 问题 : 

a 对 每 个 时 隙 ， 在 到 达 分 组 处 理 后 (上述 步 又 1) 但 在 任何 分 组 通过 队列 传输 并 去 除 一 个 令 牌 之 前 
的 那个 时 刻 ， 指 出 位 于 队列 中 的 分 组 和 位 于 桶 中 的 令 牌 数量 。 因 此 ， 对 于 在 上 述 例子 中 的 :=0 
时 刻 的 时 阶 ， 分 组 1、2 和 3 位 于 队列 中 ， 桶 中 有 两 个 令 牌 。 

b. 对 每 个 时 隙 ， 指 出 在 令 牌 从 队列 中 去 除 后 哪个 分 组 出 现在 输出 链 路 。 这 样 ， 对 于 上 述 例子 中 的 
:=0 时 阶 ， 在 时 阶 0 期 间 ， 分 组 1 和 2 从 漏 桶 出 现在 输出 链 路 上 。 

PLS. 重复 习题 P17， 但 假设 r=2。 再 次 假设 初始 时 桶 是 满 的 。 

P19. 考虑 习题 P18 并 假设 现在 r=3 且 b =2 与 以 前 一 样 。 你 对 上 述 问题 的 回答 有 变化 吗 ? 

P20. 考虑 一 下 监管 分 组 流 的 平均 速率 和 突 发 长 度 的 漏 本 监管 器 。 我 们 现在 也 要 监管 峰值 速率 p。 说 明 这 
个 漏 桶 监管 器 的 输出 如 何 能 够 提供 给 第 二 个 沁 枉 监管 器 ， 使 得 这 两 个 品行 的 漏 桶 能 够 监管 平均 束 
率 、 峰 值 速率 和 突 发 长 度 。 要 给 出 第 二 个 监管 器 的 桶 长 度 和 令 牌 产生 速率 。 

P21. 如 果 对 于 任何 来 说 ,在 每 个 时 间 间隔 长 度 + 内 到 达 漏 桶 的 分 组 数 小 于 rt +6 个， 那么 就 说 分 组 流 符 
合 一 个 突 发 长 度 和 平均 速率 r 的 漏 桶 规范 〔r，5) 。 一 个 符合 漏 桶 规范 (r，5) 的 分 组 流 必须 在 参 
Cr 和 的 漏 桶 监管 器 那里 等 待 吗 ? 评估 你 的 答案 。 

P22. 说 明 只 要 < Rw,/( Zw,) ， 那 么 ds 实际 上 是 流 1 中 任何 分 组 在 WFQ 队列 中 要 经 受 的 最 大 时 延 


K 编程 作业 


在 这 个 实验 中 ， 将 实现 流 式 视频 服务 器 和 客户 。 该 客户 使 用 实时 流 协议 (RTSP) 来 控制 服务 器 的 动 
作 。 服 务 器 使 用 实时 协议 (RTP) 来 分 组 化 视频 以 便 在 UDP 上 传输 。 将 为 你 提供 在 客户 和 服务 器 中 部 分 
实现 了 RTSP 和 RTP 的 Python 代码 ， 你 的 工作 是 完成 客户 和 服务 器 代码 。 当 完成 时 ， 你 将 已 经 创建 了 一 
个 进行 下 面 工作 的 客户 -服务 器 应 用 : 

e 客户 发 送 SETUP, PLAY, PAUSE 和 TEARDOWN 等 RTSP 命令 ， 并 且 服 务 器 应 答 这 些 命令 。 

© 当 服 务 器 处 于 播放 状态 ， 它 周期 地 抓 取 存储 的 JPEG 帧 ， 用 RTP 对 该 帧 分 组 化 ， 并 将 该 RTP 分 组 

发 送 到 一 个 UDP 套 接 字 中 。 

。 客户 接收 该 RTP 分 组 ， 去 除 JPEG 帧 ， 解 压缩 该 帧 ， 并 在 客户 的 监管 器 上 再 现 该 帧 。 

为 你 提供 的 代码 在 服务 器 实现 RTSP 协议 ， 在 客户 实现 对 RTP 解 分 组 化 。 这 个 代码 也 考虑 传输 视频 
的 显示 。 你 需要 在 客户 实现 RTSP 和 RTP 服务 器 。 该 编程 作业 将 极 大 地 增强 学 生 对 RTP、RTSP 和 流 式 视 
频 的 理解 。 我 们 极力 推荐 它 。 该 作业 也 建议 进行 大 量 可 选 的 练习 ， 包 括 在 客户 和 服务 器 实现 RTSP 的 
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DESCRIBE 命令 。 你 能 够 在 Web 站 点 http://www. pearsonhighered. com/cs- resources 找到 该 作业 的 全 部 细节 
以 及 RTSP 协议 的 概述 。 


MW 人 物 专访 


Henning Schulzrinne 是 哥伦比亚 大 学 的 教授 、 计 算 机 科学 系 的 主任 和 因 
特 网 实时 实验 室 的 负责 人 。 他 是 RTP, RTSP, SIP 和 GIST 这 些 音频 和 视频 经 
因特网 通信 的 关键 协议 的 作者 之 一 。Henning 在 德国 达 姆 施 塔 特工 业 大 学 
(TU Darmstadt) 获得 了 电气 工业 工程 学 士 学 位 ， 在 辛辛那提 大 学 获得 了 电气 
和 计算 机 工程 硕士 学 位 ， 以 及 在 马萨诸塞 大 学 阿 默 斯 特 学 院 获得 了 电气 工程 
博士 学 位 。 


。 是 什么 使 得 您 决定 致力 于 多 媒体 网 络 ? 

这 几乎 是 巧合 。 作 为 一 个 博士 生 ， 我 从 事 DARTnet 方面 的 工作 ，DARTnet 是 w 
一 个 用 TI 线路 跨越 美国 的 实验 网 络 。DARTnet 用 于 为 多 播 和 因特网 实时 工具 提 ening Schulzrinne 
供 场所 。 这 促使 我 写 了 我 的 第 一 个 音频 工具 NeVoT。 通 过 一 些 DARTnet 的 参与 者 ， 我 开始 参与 ETF 和 那 
时 新 成 立 的 音频 视频 传输 工作 组 的 工作 。 这 个 工作 组 后 来 完成 了 RTP 的 标准 化 。 

。 您 在 计算 机 行业 中 的 第 一 份 工作 是 什么 ? 它 给 了 您 什么 收获 ? 

我 在 计算 机 行业 的 第 一 份 工作 是 在 加 利 福 尼 亚 的 Livermore 读 高 中 时 焊接 一 个 牵 牛 星 (Altair) 计算 
机 工具 包 。 回 到 德国 ， 我 开 了 一 个 小 咨询 公司 来 给 旅行 社 设计 一 个 地 址 管理 程序 ， 为 我 们 的 TRS-80 开发 
了 将 数据 存储 在 磁带 上 的 功能 ， 并 通过 一 个 自己 制作 的 硬件 接口 把 IBM 的 电动 打字 机 作为 打印 机 使 用 。 

我 第 一 份 真正 的 工作 是 在 AT&T 的 贝尔 实验 室 ， 为 在 实验 室 环境 下 构建 实验 网 络 而 研发 的 一 个 网 络 
仿真 器 。 

。 因特网 实时 实验 室 的 目的 是 什么 ? 

我 们 的 目的 是 为 因特网 作为 单一 的 未 来 通信 基础 设施 提供 组 件 和 构件 模块 。 这 包括 开发 新 协议 ， 如 
GIST (用 于 网 络 层 信 令 ) 和 LoST (用 于 由 位 置 寻找 资源 ) ， 或 通过 在 丰富 呈现 、 对 等 系统 、 下 一 代 紧 急 
情况 呼叫 和 服务 产生 工具 等 方面 的 工作 加 强 我 们 以 前 从 事 的 协议 ， 如 SIP。 最近， 我 们 也 大 规模 地 研究 了 
用 于 VoIP 的 无 线 系统 ， 因 为 802. 11b 和 802. 11n 网 络 以 及 也 许 WiMAX 网 络 有 可 能 成 为 用 于 电话 的 重要 
的 最 后 1 英里 技术 。 我 们 也 试图 使 用 一 种 称 为 DYSWIS (Do You See What 1 See， 你 所 见 即 我 所 见 ) 的 对 
等 方 到 对 等 方 故障 诊断 系统 ， 大 大 改进 用 户 在 面 对 提 供 商 和 设备 的 复杂 、 混 乱 问 题 时 的 故障 诊断 能 力 。 

通过 构建 原型 和 开放 源码 系统 、 测 量 实际 系统 的 性 能 ， 以 及 对 IETF 标准 做 出 贡献 ， 我 们 试图 做 些 实 
践 性 相关 工作 。 

。 您 对 多 媒体 网 络 的 未 来 展望 是 什么 ? 

我 们 现在 正 处 于 一 种 过 渡 阶段 ， 距 离 IP 成 为 从 IPTV 到 VoIP 等 多 媒体 服务 的 通用 平台 只 有 几 年 之 遥 
了 。 我 们 期 望 着 收音 机 、 电 话 和 电视 即使 在 暴风 雨 和 地 震中 都 能 工作 ， 所 以 当 因特网 接替 了 这 些 专用 网 
络 的 职责 时 ， 用 户 将 期 待 有 同样 级 别 的 可 靠 性 。 

我 们 将 不 得 不 学 会 为 一 个 生态 系统 设计 网 络 技术 ， 该 生态 系统 包括 竞争 的 电信 公司 、 服 务 和 内 容 提 
供 商 ， 服 务 于 大 量 技术 上 未 受训 练 的 用 户 ， 并 保护 他 们 免 受 少数 但 具有 破坏 性 的 一 批 恶 意 和 犯罪 用 户 的 
侵害 。 改 变 协 议 变 得 日 益 艰难 。 协 议 也 变 得 更 为 复杂 ， 因 为 它们 需要 考虑 竞争 的 商业 利益 、 安 全 性 、 隐 
私 以 及 由 防火 墙 和 网 络 地 址 转换 引起 的 网 络 透明 性 的 欠缺 。 

因为 多 媒体 网 络 正在 成 为 几乎 所 有 消费 者 娱乐 的 基础 ， 因 此 以 低 成 本 管理 非常 大 的 网 络 将 成 为 重点 。 
用 户 将 期 待 易于 使 用 的 网 络 ， 例 如 可 以 在 所 有 的 设备 上 找到 相同 的 内 容 。 

。 为 什么 SIP 的 未 来 很 有 前 途 ? 

随 着 现在 的 无 线 网 络 正在 向 3G 网 络 升级 ， 希 望 单个 多 媒体 信 令 机 制 能 够 跨越 所 有 类 型 的 网 络 ， 包 
括 从 电缆 调制 解 调 器 到 企业 电话 网 和 公用 无 线 网 络 。 这 连同 软件 无 线 电 -一道 ， 在 将 来 使 下 列 东西 成 为 可 
能 : 单一 设备 能 被 用 于 家 庭 网 络 中 ， 能 被 作为 无 绳 蓝牙 电话 ， 用 于 经 802. 11 的 企业 网 中 和 经 3G 网 络 的 
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广域网 中 。 即 使 在 我 们 有 这 样 一 个 通用 的 无 线 设 备 之 前 ， 个 人 移动 机 制 使 得 隐藏 网 络 之 间 差 别 成 为 可 能 。 
一 个 标识 成 为 找到 一 个 人 的 通用 方法 ， 而 不 必 记 住 或 者 分 发 一 堆 特定 技术 或 特定 位 置 的 电话 号 码 。 

SIP 还 将 提供 语音 ( 比特 ) 传输 和 语音 服务 分 离 。 现 在 打破 本 地 电话 垄断 在 技术 上 已 成 为 可 能 ， 即 
一 个 公司 提供 中 性 的 比特 传输 ， 其 他 的 公司 提供 下 “拨号 音 ” 和 常用 的 电话 服务 ， 例 如 网 关 、 呼 叫 转移 
MEM 4 ID, 

除了 多 媒体 信 令 ，SIP 提供 在 因特网 中 缺少 的 一 种 新 服务 : 事件 通知 。 我 们 已 经 有 了 这 种 具有 HTTP 
不 完善 系统 和 电子 邮件 功能 的 近似 服务 ， 但 是 这 决 不 会 令 人 非常 满意 。 因 为 事件 是 对 分 布 式 系统 的 通用 
抽象 ， 这 样 可 能 简化 新 服务 的 构建 。 

。 您 对 进入 网 络 领域 的 学 生 有 什么 忠告 吗 ? 

网 络 沟通 了 多 个 学 科 。 它 源 于 电子 工程 和 计算 机 科学 、 运 筹 学 、 经 济 学 和 其 他 学 科 的 所 有 方面 。 因 
此 ， 网 络 研究 者 必须 熟悉 除了 协议 和 路 由 选择 算法 以 外 的 主题 。 

既然 网 络 已 经 成 为 日 常生 活 中 如 此 重要 的 一 部 分 ， 要 在 该 领域 标新立异 的 学 生 们 应 当 思 考 网 络 中 新 
的 资源 限制 : 人 的 时 间 及 努力 ， 而 不 只 是 带宽 或 存储 。 

从 事 网 络 研究 工作 能 够 给 人 以 极 大 的 满足 ， 因 为 它 使 得 人 们 能 够 相互 通信 和 交换 思想 ， 这 是 人 类 所 
必需 的 。 因 特 网 服务 提供 商 已 经 成 为 第 三 大 全 球 性 基础 设施 ， 接 近 于 运输 系统 和 能 源 分 配 。 经 济 领域 几 
乎 没有 哪个 部 分 离开 高 性 能 网 络 还 能 正常 运转 ， 由 此 对 可 预测 的 将 来 应 当 有 大 量 机 会 。 
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有 关 因 特 网 请 求 评论 (RFC) 的 说 明 。 因 特 网 REC 的 副本 在 多 个 网 站 上 都 可 找到 。 
因特网 协会 (监管 RFC 文档 的 组 织 ) 的 REC 编辑 们 维护 着 网 站 http://www. rfc-editor. orgo 
该 网 站 允许 你 通过 标题 、 编 号 或 作者 来 搜索 某 个 特定 的 RFC 文档 ， 并 将 显示 出 对 任何 所 
列 RFC 的 更 新 。 因 特 网 RFC 可 以 被 后 面 的 RFC 所 更 新 或 淘汰 。 我 们 喜欢 的 获取 RFC 文档 
的 网 站 是 初始 REC 源 ， 即 http://www. rfc-editor. org. 

[3GPP 2016] Third Generation Partnership Project homepage, http://www.3gpp.org/ 


[Abramson 1970] N. Abramson, “The Aloha System 一 Another Alternative for 
Computer Communications,” Proc. 1970 Fall Joint Computer Conference, AFIPS 
Conference, p. 37, 1970. 


[Abramson 1985] N. Abramson, “Development of the Alohanet,” JEEE Transac- 
tions on Information Theory, Vol. IT-31, No. 3 (Mar. 1985), pp. 119-123. 


[Abramson 2009] N. Abramson, “The Alohanet—Surfing for Wireless Data,” 
IEEE Communications Magazine, Vol. 47, No. 12, pp. 21-25. 


[Adhikari 2011a] V. K. Adhikari, S. Jain, Y. Chen, Z. L. Zhang, “Vivisecting 
YouTube: An Active Measurement Study,” Technical Report, University of 
Minnesota, 2011. 


[Adhikari 2012] V. K. Adhikari, Y. Gao, F. Hao, M. Varvello, V. Hilt, M. Steiner, 
Z. L. Zhang, “Unreeling Netflix: Understanding and Improving Multi-CDN Movie 
Delivery,” Technical Report, University of Minnesota, 2012. 


[Afanasyev 2010] A. Afanasyev, N. Tilley, P. Reiher, L. Kleinrock, “Host-to-Host 
Congestion Control for TCP,” IEEE Communications Surveys & Tutorials, Vol. 12, 
No. 3, pp. 304-342. 


[Agarwal 2009] S. Agarwal, J. Lorch, “Matchmaking for Online Games and Other 
Latency-sensitive P2P Systems,” Proc. 2009 ACM SIGCOMM. 


[Ager 2012] B. Ager, N. Chatzis, A. Feldmann, N. Sarrar, S. Uhlig, W. Willinger, 
“Anatomy of a Large European ISP,” Sigcomm, 2012. 


[Ahn 1995] J. S. Ahn, P. B. Danzig, Z. Liu, and Y. Yan, “Experience with TCP 
Vegas: Emulation and Experiment,” Proc. 1995 ACM SIGCOMM (Boston, MA, 
Aug. 1995), pp. 185-195. 


[Akamai 2016] Akamai homepage, http://www.akamai.com 


[Akella 2003] A. Akella, S. Seshan, A. Shaikh, “An Empirical Evaluation of Wide- 
Area Internet Bottlenecks,” Proc. 2003 ACM Internet Measurement Conference 


参考 文献 





(Miami, FL, Nov. 2003). 


[Akhshabi 2011] S. Akhshabi, A. C. Begen, C. Dovrolis, “An Experimental Evalu- 
ation of Rate-Adaptation Algorithms in Adaptive Streaming over HTTP,” Proc. 2011 
ACM Multimedia Systems Conf. 


[Akyildiz 2010] I. Akyildiz, D. Gutierrex-Estevez, E. Reyes, “The Evolution to 4G 
Cellular Systems, LTE Advanced,” Physical Communication, Elsevier, 3 (2010), 
217-244. 


[Albitz 1993] P. Albitz and C. Liu, DNS and BIND, O'Reilly & Associates, Petaluma, 
CA, 1993. 


[Al-Fares 2008] M. Al-Fares, A. Loukissas, A. Vahdat, “A Scalable, Commodity 
Data Center Network Architecture,” Proc. 2008 ACM SIGCOMM. 


[Amazon 2014] J. Hamilton, “AWS: Innovation at Scale, YouTube video, https:// 
www. youtube.com/watch?v=JIQETrFC_SQ 


[Anderson 1995] J. B. Andersen, T. S. Rappaport, S. Yoshida, “Propagation Mea- 
surements and Models for Wireless Communications Channels,” IEEE Communi- 
cations Magazine, (Jan. 1995), pp. 42-49. 


[Alizadeh 2010] M. Alizadeh, A. Greenberg, D. Maltz, J. Padhye, P. Patel, 
B. Prabhakar, S. Sengupta, M. Sridharan. “Data center TCP (DCTCP),” ACM 
SIGCOMM 2010 Conference, ACM, New York, NY, USA, pp. 63-74. 


[Allman 2011] E. Allman, “The Robustness Principle Reconsidered: Seeking a 
Middle Ground,” Communications of the ACM, Vol. 54, No. 8 (Aug. 2011), pp. 
40-45. 


[Appenzeller 2004] G. Appenzeller, I. Keslassy, N. McKeown, “Sizing Router 
Buffers,” Proc. 2004 ACM SIGCOMM (Portland, OR, Aug. 2004). 


[ASO-ICANN 2016] The Address Supporting Organization homepage, 
http://www.aso.icann.org 


[AT&T 2013] “AT&T Vision Alignment Challenge Technology Survey,” AT&T 
Domain 2.0 Vision White Paper, November 13, 2013. 


[Atheros 2016] Atheros Communications Inc., “Atheros AR5006 WLAN Chipset 
Product Bulletins,” http://www.atheros.com/pt/AR5006Bulletins.htm 


[Ayanoglu 1995] E. Ayanoglu, S. Paul, T. F. La Porta, K. K. Sabnani, R. D. Gitlin, 
“AIRMAIL: A Link-Layer Protocol for Wireless Networks,” ACM ACM/Baltzer 
Wireless Networks Journal, 1: 47—60, Feb. 1995. 


[Bakre 1995] A. Bakre, B. R. Badrinath, “I-TCP: Indirect TCP for Mobile Hosts,” 
Proc. 1995 Int. Conf. on Distributed Computing Systems (ICDCS) (May 1995), 
pp. 136-143. 


[Balakrishnan 1997] H. Balakrishnan, V. Padmanabhan, S. Seshan, R. Katz, 
“A Comparison of Mechanisms for Improving TCP Performance Over Wireless 
Links,” JEEE/ACM Transactions on Networking Vol. 5, No. 6 (Dec. 1997). 


[Balakrishnan 2003] H. Balakrishnan, F. Kaashoek, D. Karger, R. Morris, I. 
Stoica, “Looking Up Data in P2P Systems,” Communications of the ACM, Vol. 46, 
No. 2 (Feb. 2003), pp. 43-48. 


[Baldauf 2007] M. Baldauf, S. Dustdar, F. Rosenberg, “A Survey on Context- 
Aware Systems,” Int. J. Ad Hoc and Ubiquitous Computing, Vol. 2, No. 4 (2007), 
pp. 263-277. 


[Baran 1964] P. Baran, “On Distributed Communication Networks,” JEEE Trans- 
actions on Communication Systems, Mar. 1964. Rand Corporation Technical report 


481 


482 


参考 文献 





with the same title (Memorandum RM-3420-PR, 1964). http://www.rand.org/publi- 
cations/RM/RM3420/ 


[Bardwell 2004] J. Bardwell, “You Believe You Understand What You Think I 
Said . . . The Truth About 802.11 Signal and Noise Metrics: A Discussion Clarify- 
ing Often-Misused 802.11 WLAN Terminologies,” http://www.connect802.com/ 
download/techpubs/2004/you_believe_D100201 .pdf 


[Barford 2009] P. Barford, N, Duffield, A. Ron, J. Sommers, “Network Perfor- 
mance Anomaly Detection and Localization,” Proc. 2009 IEEE INFOCOM 
(Apr. 2009). 


[Baronti 2007] P. Baronti, P. Pillai, V. Chook, S. Chessa, A. Gotta, Y. Hu, 
“Wireless Sensor Networks: A Survey on the State of the Art and the 802.15.4 
and ZigBee Standards,” Computer Communications, Vol. 30, No. 7 (2007), pp. 
1655-1695. 


[Baset 2006] S. A. Basset and H. Schulzrinne, “An Analysis of the Skype Peer-to- 
Peer Internet Telephony Protocol,” Proc. 2006 IEEE INFOCOM (Barcelona, Spain, 
Apr. 2006). 


[BBC 2001] BBC news online “A Small Slice of Design,” Apr. 2001, http://news. 
bbc.co.uk/2/hi/science/nature/1264205.stm 


[Beheshti 2008] N. Beheshti, Y. Ganjali, M. Ghobadi, N. McKeown, G. Salmon, 
“Experimental Study of Router Buffer Sizing,” Proc. ACM Internet Measurement 
Conference (Oct. 2008, Vouliagmeni, Greece). 


[Bender 2000] P. Bender, P. Black, M. Grob, R. Padovani, N. Sindhushayana, A. 
Viterbi, “CDMA/HDR: A Bandwidth-Efficient High-Speed Wireless Data Service 
for Nomadic Users,” JEEE Commun. Mag., Vol. 38, No. 7 (July 2000), 

pp. 70-77. 


[Berners-Lee 1989] T. Berners-Lee, CERN, “Information Management: A 
Proposal,” Mar. 1989, May 1990. http://www.w3.org/History/1989/proposal 
.html 


[Berners-Lee 1994] T. Berners-Lee, R. Cailliau, A. Luotonen, H. Frystyk Nielsen, 
A. Secret, “The World-Wide Web,” Communications of the ACM, Vol. 37, No. 8 
(Aug. 1994), pp. 76-82. 


[Bertsekas 1991] D. Bertsekas, R. Gallagher, Data Networks, 2nd Ed., Prentice 
Hall, Englewood Cliffs, NJ, 1991. 


[Biersack 1992] E. W. Biersack, “Performance Evaluation of Forward Error Cor- 
rection in ATM Networks,” Proc. 1999 ACM SIGCOMM (Baltimore, MD, Aug. 
1992), pp. 248-257. 


[BIND 2016] Internet Software Consortium page on BIND, http://www. isc.org/ 
bind.html 


[Bisdikian 2001] C. Bisdikian, “An Overview of the Bluetooth Wireless Technol- 
ogy,” IEEE Communications Magazine, No. 12 (Dec. 2001), pp. 86-94. 


[Bishop 2003] M. Bishop, Computer Security: Art and Science, Boston: Addison 
Wesley, Boston MA, 2003. 


[Black 1995] U. Black, ATM Volume I: Foundation for Broadband Networks, 
Prentice Hall, 1995. 


[Black 1997] U. Black, ATM Volume IT: Signaling in Broadband Networks, Prentice 
Hall, 1997. 


[Blumenthal 2001] M. Blumenthal, D. Clark, “Rethinking the Design of the 


BRA XL dk 483 








Internet: The End-to-end Arguments vs. the Brave New World,” ACM Transactions 
on Internet Technology, Vol. 1, No. 1 (Aug. 2001), pp. 70-109. 


[Bochman 1984] G. V. Bochmann, C. A. Sunshine, “Formal Methods in Commu- 
nication Protocol Design,” JEEE Transactions on Communications, Vol. 28, No. 4 
(Apr. 1980) pp. 624-631. 


[Bolot 1996] J-C. Bolot, A. Vega-Garcia, “Control Mechanisms for Packet Audio 
in the Internet,” Proc. 1996 IEEE INFOCOM, pp. 232-239. 


[Bosshart 2013] P. Bosshart, G. Gibb, H. Kim, G. Varghese, N. McKeown, 

M. Izzard, F. Mujica, M. Horowitz, “Forwarding Metamorphosis: Fast Program- 
mable Match-Action Processing in Hardware for SDN,” ACM SIGCOMM Comput. 
Commun. Rev. 43, 4 (Aug. 2013), 99-110. 


[Bosshart 2014] P. Bosshart, D. Daly, G. Gibb, M. Izzard, N. McKeown, 

J. Rexford, C. Schlesinger, D. Talayco, A. Vahdat, G. Varghese, D. Walker, 
“P4: Programming Protocol-Independent Packet Processors,” ACM SIGCOMM 
Comput. Commun. Rev. 44, 3 (July 2014), pp. 87-95. 


[Brakmo 1995] L. Brakmo, L. Peterson, “TCP Vegas: End to End Congestion 
Avoidance on a Global Internet,” JEEE Journal of Selected Areas in Communica- 
tions, Vol. 13, No. 8 (Oct. 1995), pp. 1465-1480. 


[Bryant 1988] B. Bryant, “Designing an Authentication System: A Dialogue in 
Four Scenes,” http://web.mit.edu/kerberos/www/dialogue.html 


[Bush 1945] V. Bush, “As We May Think,” The Atlantic Monthly, July 1945. 
http://www.theatlantic.com/unbound/flashbks/computer/bushf.htm 


[Byers 1998] J. Byers, M. Luby, M. Mitzenmacher, A. Rege, “A Digital Fountain 
Approach to Reliable Distribution of Bulk Data,” Proc. 1998 ACM SIGCOMM 
(Vancouver, Canada, Aug. 1998), pp. 56-67. 


[Caesar 2005a] M. Caesar, D. Caldwell, N. Feamster, J. Rexford, A. Shaikh, J. van 
der Merwe, “Design and implementation of a Routing Control Platform,” Proc. 
Networked Systems Design and Implementation (May 2005). 


[Caesar 2005b] M. Caesar, J. Rexford, “BGP Routing Policies in ISP Networks,” 
IEEE Network Magazine, Vol. 19, No. 6 (Nov. 2005). 


[Caldwell 2012] C. Caldwell, “The Prime Pages,” http://www.utm.edu/research/ 
primes/prove 


[Cardwell 2000] N. Cardwell, S. Savage, T. Anderson, “Modeling TCP Latency,” 
Proc. 2000 IEEE INFOCOM (Tel-Aviv, Israel, Mar. 2000). 


[Casado 2007] M. Casado, M. Freedman, J. Pettit, J. Luo, N. McKeown, S. Shen- 
ker, “Ethane: Taking Control of the Enterprise,” Proc. ACM SIGCOMM '07, New 
York, pp. 1-12. See also IEEE/ACM Trans. Networking, 17, 4 (Aug. 2007), pp. 
270-1283. 


[Casado 2009] M. Casado, M. Freedman, J. Pettit, J. Luo, N. Gude, N. McKeown, 
S. Shenker, “Rethinking Enterprise Network Control,” IEEE/ACM Transactions on 
Networking (ToN), Vol. 17, No. 4 (Aug. 2009), pp. 1270-1283. 


[Casado 2014] M. Casado, N. Foster, A. Guha, “Abstractions for Software- 
Defined Networks,” Communications of the ACM, Vol. 57 No. 10, (Oct. 2014), 
pp. 86-95. 


[Cerf 1974] V. Cerf, R. Kahn, “A Protocol for Packet Network Interconnection,” 
IEEE Transactions on Communications Technology, Vol. COM-22, No. 5, pp. 
627-641. 


[CERT 2001-09] CERT, “Advisory 2001—09: Statistical Weaknesses in TCP/IP 


484 


参考 文献 





Initial Sequence Numbers,” http://www.cert.org/advisories/CA-2001-09.html 


[CERT 2003-04] CERT, “CERT Advisory CA-2003-04 MS-SQL Server Worm,” 
http://www.cert.org/advisories/CA-2003-04. html 


[CERT 2016] CERT, http://www.cert.org 


[CERT Filtering 2012] CERT, “Packet Filtering for Firewall Systems,” http:// 
www.cert.org/tech_tips/packet_filtering.html 


[Cert SYN 1996] CERT, “Advisory CA-96.21: TCP SYN Flooding and IP Spoof- 
ing Attacks,” http://www.cert.org/advisories/CA-1998-01.html 


[Chandra 2007] T. Chandra, R. Greisemer, J. Redstone, “Paxos Made Live: an 
Engineering Perspective,” Proc. of 2007 ACM Symposium on Principles of Distrib- 
uted Computing (PODC), pp. 398-407. 


[Chao 2001] H. J. Chao, C. Lam, E. Oki, Broadband Packet Switching Technol- 
ogies—A Practical Guide to ATM Switches and IP Routers, John Wiley & Sons, 
2001. 


[Chao 2011] C. Zhang, P. Dunghel, D. Wu, K. W. Ross, “Unraveling the 
BitTorrent Ecosystem,” JEEE Transactions on Parallel and Distributed Systems, 
Vol. 22, No. 7 (July 2011). 


[Chen 2000] G. Chen, D. Kotz, “A Survey of Context-Aware Mobile Computing 
Research,” Technical Report TR2000-381, Dept. of Computer Science, Dartmouth 
College, Nov. 2000. http://www.cs.dartmouth.edu/reports/TR2000-38 1 .pdf 


[Chen 2006] K.-T. Chen, C.-Y. Huang, P. Huang, C.-L. Lei, “Quantifying Skype 
User Satisfaction,” Proc. 2006 ACM SIGCOMM (Pisa, Italy, Sept. 2006). 


[Chen 2011] Y. Chen, S. Jain, V. K. Adhikari, Z. Zhang, “Characterizing Roles 
of Front-End Servers in End-to-End Performance of Dynamic Content Distribu- 
tion,” Proc. 2011 ACM Internet Measurement Conference (Berlin, Germany, 
Nov. 2011). 


[Cheswick 2000] B. Cheswick, H. Burch, S. Branigan, “Mapping and Visualizing 
the Internet,” Proc. 2000 Usenix Conference (San Diego, CA, June 2000). 


[Chiu 1989] D. Chiu, R. Jain, “Analysis of the Increase and Decrease Algorithms 
for Congestion Avoidance in Computer Networks,” Computer Networks and ISDN 
Systems, Vol. 17, No. 1, pp. 1-14. http://www.cs.wustl.edu/~jain/papers/cong_ 

av. htm 


[Christiansen 2001] M. Christiansen, K. Jeffay, D. Ott, F. D. Smith, “Tuning Red 
for Web Traffic,” IEEE/ACM Transactions on Networking, Vol. 9, No. 3 (June 
2001), pp. 249-264. 


[Chuang 2005] S. Chuang, S. Iyer, N. McKeown, “Practical Algorithms for Perfor- 
mance Guarantees in Buffered Crossbars,” Proc. 2005 IEEE INFOCOM. 


[Cisco 802.11ac 2014] Cisco Systems, “802.1 lac: The Fifth Generation of Wi-Fi,” 
Technical White Paper, Mar. 2014. 


[Cisco 7600 2016] Cisco Systems, “Cisco 7600 Series Solution and Design Guide,” 
http://www.cisco.com/en/US/products/hw/routers/ps368/prod_technical_ 
reference09186a0080092246.html 


[Cisco 8500 2012] Cisco Systems Inc., “Catalyst 8500 Campus Switch Router 
Architecture,” http://www.cisco.com/univercd/cc/td/doc/product/l3sw/8540/ 
rel_12_0/w5_6f/softenfg/1cfg8500.pdf 


[Cisco 12000 2016] Cisco Systems Inc., “Cisco XR 12000 Series and Cisco 12000 
Series Routers,” http://www.cisco.com/en/US/products/ps6342/index.html 


参考 文献 





[Cisco 2012] Cisco 2012, Data Centers, http://www.cisco.com/go/dce 


[Cisco 2015] Cisco Visual Networking Index: Forecast and Methodology, 2014— 
2019, White Paper, 2015. 


[Cisco 6500 2016] Cisco Systems, “Cisco Catalyst 6500 Architecture White 
Paper,” http://www.cisco.com/c/en/us/products/collateral/switches/ 
catalyst-6500-series-switches/prod_white_paper0900aecd80673385.html 


[Cisco NAT 2016] Cisco Systems Inc., “How NAT Works,” http://www.cisco. 
com/en/US/tech/tk648/tk36 1/technologies_tech_note09186a008009483 1.shtml 


[Cisco QoS 2016] Cisco Systems Inc., “Advanced QoS Services for the Intelligent 
Internet,” http://www.cisco.com/warp/public/cc/pd/iosw/ioft/iogo/tech/qos_wp.htm 


[Cisco Queue 2016] Cisco Systems Inc., “Congestion Management Overview,” 
http://www.cisco.com/en/US/docs/ios/12_2/qos/configuration/guide/qcfconmg. 
html 


[Cisco SYN 2016] Cisco Systems Inc., “Defining Strategies to Protect Against 
TCP SYN Denial of Service Attacks,” http://www.cisco.com/en/US/tech/tk828/ 
technologies_tech_note09186a00800f67d5.shtml 


[Cisco TCAM 2014] Cisco Systems Inc., “CAT 6500 and 7600 Series Routers and 
Switches TCAM Allocation Adjustment Procedures,” http://www.cisco.com/c/en/ 
us/support/docs/switches/catalyst-6500-series-switches/1 177 12-problemsolution- 
cat6500-00.html 


[Cisco VNI 2015] Cisco Systems Inc., “Visual Networking Index,” http://www. 
cisco.com/web/solutions/sp/vni/vni_forecast_highlights/index.html 


[Clark 1988] D. Clark, “The Design Philosophy of the DARPA Internet Proto- 
cols,” Proc. 1988 ACM SIGCOMM (Stanford, CA, Aug. 1988). 


[Cohen 1977] D. Cohen, “Issues in Transnet Packetized Voice Communication,” 
Proc. Fifth Data Communications Symposium (Snowbird, UT, Sept. 1977), 
pp. 6-13. 


[Cookie Central 2016] Cookie Central homepage, http://www.cookiecentral.com/ 
n_cookie_faq.htm 

[Cormen 2001] T. H. Cormen, Introduction to Algorithms, 2nd Ed., MIT Press, 
Cambridge, MA, 2001. 


[Crow 1997] B. Crow, I. Widjaja, J. Kim, P. Sakai, “IEEE 802.11 Wireless 
Local Area Networks,” JEEE Communications Magazine (Sept. 1997), 
pp. 116-126. 


[Cusumano 1998] M. A. Cusumano, D. B. Yoffie, Competing on Internet Time: 
Lessons from Netscape and Its Battle with Microsoft, Free Press, New York, NY, 
1998. 


[Czyz 2014] J. Czyz, M. Allman, J. Zhang, S. Iekel-Johnson, E. Osterweil, M. Bai- 
ley, “Measuring IPv6 Adoption,” Proc. ACM SIGCOMM 2014, ACM, New York, 
NY, USA, pp. 87-98. 


[Dahlman 1998] E. Dahlman, B. Gudmundson, M. Nilsson, J. Sköld, “UMTS/ 
IMT-2000 Based on Wideband CDMA,” IEEE Communications Magazine (Sept. 
1998), pp. 70-80. 


[Daigle 1991] J. N. Daigle, Queuing Theory for Telecommunications, Addison- 
Wesley, Reading, MA, 1991. 


[DAM 2016] Digital Attack Map, http://www.digitalattackmap.com 


[Davie 2000] B. Davie and Y. Rekhter, MPLS: Technology and Applications, 
Morgan Kaufmann Series in Networking, 2000. 


485 


486 


参考 文献 





[Davies 2005] G. Davies, F. Kelly, “Network Dimensioning, Service Costing, and 
Pricing in a Packet-Switched Environment,” Telecommunications Policy, Vol. 28, 
No. 4, pp. 391-412. 


[DEC 1990] Digital Equipment Corporation, “In Memoriam: J. C. R. Licklider 
1915-1990,” SRC Research Report 61, Aug. 1990. http://www.memex.org/ 
licklider.pdf 

[DeClercq 2002] J. DeClercq, O. Paridaens, “Scalability Implications of Virtual 
Private Networks,’ JEEE Communications Magazine, Vol. 40, No. 5 (May 2002), 
pp. 151-157. 


[Demers 1990] A. Demers, S. Keshav, S. Shenker, “Analysis and Simulation of a 
Fair Queuing Algorithm,” Internetworking: Research and Experience, Vol. 1, No. | 
(1990), pp. 3-26. 


[dhe 2016] IETF Dynamic Host Configuration working group homepage, http:// 
www.ietf.org/html.charters/dhce-charter.html 


[Dhungel 2012] P. Dhungel, K. W. Ross, M. Steiner., Y. Tian, X. Hei, “Xunlei: 


Peer-Assisted Download Acceleration on a Massive Scale,” Passive and Active 
Measurement Conference (PAM) 2012, Vienna, 2012. 


[Diffie 1976] W. Diffie, M. E. Hellman, “New Directions in Cryptography,” IEEE 
Transactions on Information Theory, Vol IT-22 (1976), pp. 644-654. 


[Diggavi 2004] S. N. Diggavi, N. Al-Dhahir, A. Stamoulis, R. Calderbank, “Great 
Expectations: The Value of Spatial Diversity in Wireless Networks,” Proceedings 
of the IEEE, Vol. 92, No. 2 (Feb. 2004). 


[Dilley 2002] J. Dilley, B. Maggs, J. Parikh, H. Prokop, R. Sitaraman, B. Weihl, 
“Globally Distributed Content Delivert,” JEEE Internet Computing (Sept.—Oct. 
2002). 


[Diot 2000] C. Diot, B. N. Levine, B. Lyles, H. Kassem, D. Balensiefen, “Deploy- 
ment Issues for the IP Multicast Service and Architecture,” JEEE Network, Vol. 14, 
No. 1 (Jan./Feb. 2000) pp. 78-88. 


[Dischinger 2007] M. Dischinger, A. Haeberlen, K. Gummadi, S. Saroiu, “Charac- 
terizing residential broadband networks,” Proc. 2007 ACM Internet Measurement 
Conference, pp. 24-26. 


[Dmitiropoulos 2007] X. Dmitiropoulos, D. Krioukov, M. Fomenkov, B. Huffaker, 
Y. Hyun, K. C. Claffy, G. Riley, “AS Relationships: Inference and Validation,” 
ACM Computer Communication Review (Jan. 2007). 


[DOCSIS 2011] Data-Over-Cable Service Interface Specifications, DOCSIS 3.0: 
MAC and Upper Layer Protocols Interface Specification, CM-SP-MULPIv3.0- 
116-110623, 2011. 


[Dodge 2016] M. Dodge, “An Atlas of Cyberspaces,” http://www.cybergeography. 
org/atlas/isp_maps.html 


[Donahoo 2001] M. Donahoo, K. Calvert, TCP/IP Sockets in C: Practical Guide 
for Programmers, Morgan Kaufman, 2001. 


[DSL 2016] DSL Forum homepage, http://www.dslforum.org/ 


[Dhunghel 2008] P. Dhungel, D. Wu, B. Schonhorst, K.W. Ross, “A Measurement 
Study of Attacks on BitTorrent Leechers,” 7th International Workshop on Peer-to- 
Peer Systems (IPTPS 2008) (Tampa Bay, FL, Feb. 2008). 


[Droms 2002] R. Droms, T. Lemon, The DHCP Handbook (2nd Edition), SAMS 
Publishing, 2002. 


[Edney 2003] J. Edney and W. A. Arbaugh, Real 802.11 Security: Wi-Fi Protected 
Access and 802.11i, Addison-Wesley Professional, 2003. 


参考 文献 





[Edwards 2011] W. K. Edwards, R. Grinter, R. Mahajan, D. Wetherall, “Advancing 
the State of Home Networking,” Communications of the ACM, Vol. 54, No. 6 (June 
2011), pp. 62-71. 


[Ellis 1987] H. Ellis, “The Story of Non-Secret Encryption,” http://jya.com/ellis- 
doc. htm 


[Erickson 2013] D. Erickson, “ The Beacon Openflow Controller,” 2nd ACM SIG- 
COMM Workshop on Hot Topics in Software Defined Networking (HotSDN "13). 
ACM, New York, NY, USA, pp. 13-18. 


[Ericsson 2012] Ericsson, “The Evolution of Edge,” http://www.ericsson.com/ 
technology/whitepapers/broadband/evolution_of_EDGE.shtml 


[Facebook 2014] A. Andreyev, “Introducing Data Center Fabric, the Next- 
Generation Facebook Data Center Network,” https://code.facebook.com/ 


posts/360346274 145943/introducing-data-center-fabric-the-next-generation-face- 
book-data-center-network 


[Faloutsos 1999] C. Faloutsos, M. Faloutsos, P. Faloutsos, “What Does the Internet 
Look Like? Empirical Laws of the Internet Topology,” Proc. 1999 ACM SIG- 
COMM (Boston, MA, Aug. 1999). 


[Farrington 2010] N. Farrington, G. Porter, S. Radhakrishnan, H. Bazzaz, V. Sub- 
ramanya, Y. Fainman, G, Papen, A. Vahdat, “Helios: A Hybrid Electrical/Optical 
Switch Architecture for Modular Data Centers,” Proc. 2010 ACM SIGCOMM. 


[Feamster 2004] N. Feamster, H. Balakrishnan, J. Rexford, A. Shaikh, K. van der 
Merwe, “The Case for Separating Routing from Routers,” ACM SIGCOMM Work- 
shop on Future Directions in Network Architecture, Sept. 2004. 


[Feamster 2004] N. Feamster, J. Winick, J. Rexford, “A Model for BGP Routing 
for Network Engineering,” Proc. 2004 ACM SIGMETRICS (New York, NY, June 
2004). 


[Feamster 2005] N. Feamster, H. Balakrishnan, “Detecting BGP Configuration 
Faults with Static Analysis,” NSDI (May 2005). 


[Feamster 2013] N. Feamster, J. Rexford, E. Zegura, “The Road to SDN,” ACM 
Queue, Volume 11, Issue 12, (Dec. 2013). 


[Feldmeier 1995] D. Feldmeier, “Fast Software Implementation of Error Detection 
Codes,” IEEE/ACM Transactions on Networking, Vol. 3, No. 6 (Dec. 1995), pp. 
640-652. 


[Ferguson 2013] A. Ferguson, A. Guha, C. Liang, R. Fonseca, S. Krishnamurthi, 
“Participatory Networking: An API for Application Control of SDNs,” Proceedings 
ACM SIGCOMM 2013, pp. 327-338. 


[Fielding 2000] R. Fielding, “Architectural Styles and the Design of Network- 
based Software Architectures,” 2000. PhD Thesis, UC Irvine, 2000. 


[FIPS 1995] Federal Information Processing Standard, “Secure Hash Standard,” 
FIPS Publication 180-1. http://www. itl.nist.gov/fipspubs/fip 1 80-1.htm 


[Floyd 1999] S. Floyd, K. Fall, “Promoting the Use of End-to-End Congestion 
Control in the Internet,” JEEE/ACM Transactions on Networking, Vol. 6, No. 5 
(Oct. 1998), pp. 458-472. 


[Floyd 2000] S. Floyd, M. Handley, J. Padhye, J. Widmer, “Equation-Based 
Congestion Control for Unicast Applications,” Proc. 2000 ACM SIGCOMM 
(Stockholm, Sweden, Aug. 2000). 

[Floyd 2001] S. Floyd, “A Report on Some Recent Developments in TCP Conges- 
tion Control,” IEEE Communications Magazine (Apr. 2001). 


[Floyd 2016] S. Floyd, “References on RED (Random Early Detection) Queue 
Management,” http://www. icir.org/floyd/red.html 


487 


488 


参考 文献 





[Floyd Synchronization 1994] S. Floyd, V. Jacobson, “Synchronization of Peri- 
odic Routing Messages,” IEEE/ACM Transactions on Networking, Vol. 2, No. 2 
(Apr. 1997) pp. 122-136. 

[Floyd TCP 1994] S. Floyd, “TCP and Explicit Congestion Notification,” ACM 
SIGCOMM Computer Communications Review, Vol. 24, No. 5 (Oct. 1994), pp. 
10-23. 


[Fluhrer 2001] S. Fluhrer, I. Mantin, A. Shamir, “Weaknesses in the Key Schedul- 
ing Algorithm of RC4,” Eighth Annual Workshop on Selected Areas in Cryptogra- 
phy (Toronto, Canada, Aug. 2002). 


[Fortz 2000] B. Fortz, M. Thorup, “Internet Traffic Engineering by Optimizing 
OSPF Weights,” Proc. 2000 IEEE INFOCOM (Tel Aviv, Israel, Apr. 2000). 


[Fortz 2002] B. Fortz, J. Rexford, M. Thorup, “Traffic Engineering with 
Traditional IP Routing Protocols,” IEEE Communication Magazine 

(Oct. 2002). 

[Fraleigh 2003] C. Fraleigh, F. Tobagi, C. Diot, “Provisioning IP Backbone Net- 
works to Support Latency Sensitive Traffic,” Proc. 2003 IEEE INFOCOM (San 
Francisco, CA, Mar. 2003). 

[Frost 1994] J. Frost, “BSD Sockets: A Quick and Dirty Primer,” http://world.std 
.com/~jimf/papers/sockets/sockets.html 

[FTC 2015] Internet of Things: Privacy and Security in a Connected World, Fed- 
eral Trade Commission, 2015, https://www.ftc.gov/system/files/documents/reports/ 
federal-trade-commission-staff-report-november-20 1 3-workshop-entitled-internet- 
things-privacy/150127iotrpt.pdf 

[FTTH 2016] Fiber to the Home Council, http://www.ftthcouncil.org/ 


[Gao 2001] L. Gao, J. Rexford, “Stable Internet Routing Without Global Coordi- 
nation,” IEEE/ACM Transactions on Networking, Vol. 9, No. 6 (Dec. 2001), pp. 
681-692. 

[Gartner 2014] Gartner report on Internet of Things, http://www.gartner.com/ 
technology/research/internet-of-things 


[Gauthier 1999] L. Gauthier, C. Diot, and J. Kurose, “End-to-End Transmission 
Control Mechanisms for Multiparty Interactive Applications on the Internet,” Proc. 
1999 IEEE INFOCOM (New York, NY, Apr. 1999). 


[Gember-Jacobson 2014] A. Gember-Jacobson, R. Viswanathan, C. Prakash, 

R. Grandl, J. Khalid, S. Das, A. Akella, “OpenNF: Enabling Innovation in Network 
Function Control,” Proc, ACM SIGCOMM 2014, pp. 163-174. 

[Goodman 1997] David J. Goodman, Wireless Personal Communications Systems, 
Prentice-Hall, 1997. 

[Google IPv6 2015] Google Inc. “IPv6 Statistics,” https://www.google.com/intl/en/ 
ipv6/statistics.html 

[Google Locations 2016] Google data centers. http://www.google.com/corporate/ 
datacenter/locations.html 

[Goralski 1999] W. Goralski, Frame Relay for High-Speed Networks, John Wiley, 
New York, 1999. 

[Greenberg 2009a] A. Greenberg, J. Hamilton, D. Maltz, P. Patel, “The Cost of a 
Cloud: Research Problems in Data Center Networks,” ACM Computer Communica- 
tions Review (Jan. 2009). 


[Greenberg 2009b] A. Greenberg, N. Jain, S. Kandula, C. Kim, P. Lahiri, D. 
Maltz, P. Patel, S. Sengupta, “VL2: A Scalable and Flexible Data Center Network,” 
Proc. 2009 ACM SIGCOMM. 


[Greenberg 2011] A. Greenberg, J. Hamilton, N. Jain, S. Kandula, C. Kim, 

P. Lahiri, D. Maltz, P. Patel, S. Sengupta, “VL2: A Scalable and Flexible Data 
Center Network,” Communications of the ACM, Vol. 54, No. 3 (Mar. 2011), 
pp. 95-104. 


参考 文献 





[Greenberg 2015] A. Greenberg, “SDN for the Cloud,” Sigcomm 2015 Keynote 
Address, http://conferences.sigcomm.org/sigcomm/2015/pdf/papers/keynote.pdf 
[Griffin 2012] T. Griffin, “Interdomain Routing Links,” http://www.cl.cam. 
ac.uk/~tgg22/interdomain/ 

[Gude 2008] N. Gude, T. Koponen, J. Pettit, B. Pfaff, M. Casado, N. McKeown, 
and S. Shenker, “NOX: Towards an Operating System for Networks,” ACM SIG- 
COMM Computer Communication Review, July 2008. 


[Guha 2006] S. Guha, N. Daswani, R. Jain, “An Experimental Study of the Skype 
Peer-to-Peer VoIP System,” Proc. Fifth Int. Workshop on P2P Systems (Santa 
Barbara, CA, 2006). 

[Guo 2005] L. Guo, S. Chen, Z. Xiao, E. Tan, X. Ding, X. Zhang, “Measurement, 
Analysis, and Modeling of BitTorrent-Like Systems,” Proc. 2005 ACM Internet 
Measurement Conference. 

[Guo 2009] C. Guo, G. Lu, D. Li, H. Wu, X. Zhang, Y. Shi, C. Tian, Y. Zhang, 

S. Lu, “BCube: A High Performance, Server-centric Network Architecture for 
Modular Data Centers,” Proc. 2009 ACM SIGCOMM. 

[Gupta 2001] P. Gupta, N. McKeown, “Algorithms for Packet Classification,” 
IEEE Network Magazine, Vol. 15, No. 2 (Mar./Apr. 2001), pp. 24-32. 

[Gupta 2014] A. Gupta, L. Vanbever, M. Shahbaz, S. Donovan, B. Schlinker, 

N. Feamster, J. Rexford, S. Shenker, R. Clark, E. Katz-Bassett, “SDX: A Software 
Defined Internet Exchange, “ Proc. ACM SIGCOMM 2014 (Aug. 2014), 

pp. 551-562. 


[Ha 2008] S. Ha, I. Rhee, L. Xu, “CUBIC: A New TCP-Friendly High-Speed TCP 
Variant,” ACM SIGOPS Operating System Review, 2008. 

[Halabi 2000] S. Halabi, /nternet Routing Architectures, 2nd Ed., Cisco Press, 
2000. 

[Hanabali 2005] A. A. Hanbali, E. Altman, P. Nain, “A Survey of TCP over Ad 


Hoc Networks,” IEEE Commun. Surveys and Tutorials, Vol. 7, No. 3 (2005), 
pp. 22-36. 


[Hei 2007] X. Hei, C. Liang, J. Liang, Y. Liu, K. W. Ross, “A Measurement Study 
of a Large-scale P2P IPTV System,” JEEE Trans. on Multimedia (Dec. 2007). 


[Heidemann 1997] J. Heidemann, K. Obraczka, J. Touch, “Modeling the Perfor- 
mance of HTTP over Several Transport Protocols,” JEEE/ACM Transactions on 
Networking, Vol. 5, No. 5 (Oct. 1997), pp. 616-630. 


[Held 2001] G. Held, Data Over Wireless Networks: Bluetooth, WAP, and Wireless 
LANs, McGraw-Hill, 2001. 

[Holland 2001] G. Holland, N. Vaidya, V. Bahl, “A Rate-Adaptive MAC Protocol 
for Multi-Hop Wireless Networks,” Proc. 2001 ACM Int. Conference of Mobile 
Computing and Networking (Mobicom01) (Rome, Italy, July 2001). 


[Hollot 2002] C.V. Hollot, V. Misra, D. Towsley, W. Gong, “Analysis and Design 
of Controllers for AQM Routers Supporting TCP Flows,” JEEE Transactions on 
Automatic Control, Vol. 47, No. 6 (June 2002), pp. 945-959. 


[Hong 2013] C. Hong, S, Kandula, R. Mahajan, M.Zhang, V. Gill, M. Nanduri, 
R. Wattenhofer, “Achieving High Utilization with Software-driven WAN,” ACM 
SIGCOMM Conference (Aug. 2013), pp.15-26. 


[Huang 2002] C. Haung, V. Sharma, K. Owens, V. Makam, “Building Reliable 
MPLS Networks Using a Path Protection Mechanism,” JEEE Communications 
Magazine, Vol. 40, No. 3 (Mar. 2002), pp. 156-162. 

[Huang 2005] Y. Huang, R. Guerin, “Does Over-Provisioning Become More or 
Less Efficient as Networks Grow Larger?,” Proc. IEEE Int. Conf. Network Proto- 
cols (ICNP) (Boston MA, Noy. 2005). 

[Huang 2008] C. Huang, J. Li, A. Wang, K. W. Ross, “Understanding Hybrid CDN- 
P2P: Why Limelight Needs Its Own Red Swoosh,” Proc. 2008 NOSSDAV, Braunsch- 


489 


490 


参考 文献 





weig, Germany. 


[Huitema 1998] C. Huitema, IPv6: The New Internet Protocol, 2nd Ed., Prentice 
Hall, Englewood Cliffs, NJ, 1998. 


[Huston 1999a] G. Huston, “Interconnection, Peering, and Settlkements—Part I,” 
The Internet Protocol Journal, Vol. 2, No. 1 (Mar. 1999). 


[Huston 2004] G. Huston, “NAT Anatomy: A Look Inside Network Address 
Translators,” The Internet Protocol Journal, Vol. 7, No. 3 (Sept. 2004). 


[Huston 2008a] G. Huston, “Confronting IPv4 Address Exhaustion,” http://www. 
potaroo.net/ispcol/2008-10/v4depletion.html 


[Huston 2008b] G. Huston, G. Michaelson, “IPv6 Deployment: Just where are 
we?” http://www.potaroo.net/ispcol/2008-04/ipv6.html 


[Huston 2011a] G. Huston, “A Rough Guide to Address Exhaustion,” The Internet 
Protocol Journal, Vol. 14, No. 1 (Mar. 2011). 


[Huston 2011b] G. Huston, “Transitioning Protocols,” The Internet Protocol Jour- 
nal, Vol. 14, No. 1 (Mar. 2011). 


[IAB 2016] Internet Architecture Board homepage, http://www.iab.org/ 


[IANA Protocol Numbers 2016] Internet Assigned Numbers Authority, Protocol 
Numbers, http://www.iana.org/assignments/protocol-numbers/protocol-numbers. 
xhtml 


[IBM 1997] IBM Corp., JBM Inside APPN - The Essential Guide to the Next- 
Generation SNA, SG24-3669-03, June 1997. 


[ICANN 2016] The Internet Corporation for Assigned Names and Numbers 
homepage, http://www.icann.org 


[IEEE 802 2016] IEEE 802 LAN/MAN Standards Committee homepage, http:// 
www.ieee802.org/ 


[IEEE 802.11 1999] IEEE 802.11, “1999 Edition (ISO/IEC 8802-11: 1999) IEEE 
Standards for Information Technology—Telecommunications and Information 
Exchange Between Systems—Local and Metropolitan Area Network—Specific 
Requirements—Part 11: Wireless LAN Medium Access Control (MAC) and 
Physical Layer (PHY) Specification,” http://standards.ieee.org/getieee802/down- 
load/802.11-1999.pdf 


[IEEE 802.11ac 2013] IEEE, “802.1 1ac-2013—IEEE Standard for Information 
technology—Telecommunications and Information Exchange Between Systems— 
Local and Metropolitan Area Networks—Specific Requirements—Part | 1: Wire- 
less LAN Medium Access Control (MAC) and Physical Layer (PHY) Specifica- 
tions—Amendment 4: Enhancements for Very High Throughput for Operation in 
Bands Below 6 GHz.” 


[IEEE 802.11n 2012] IEEE, “IEEE P802.1 1—Task Group N—Meeting Update: 
Status of 802.11n,” http://grouper.ieee.org/groups/802/1 1/Reports/tgn_update 
.htm 


[IEEE 802.15 2012] IEEE 802.15 Working Group for WPAN homepage, http:// 
grouper.ieee.org/groups/802/15/. 


[IEEE 802.15.4 2012] IEEE 802.15 WPAN Task Group 4, http://www.ieee802. 
org/15/pub/TG4.html 


[IEEE 802.16d 2004] IEEE, “IEEE Standard for Local and Metropolitan Area 
Networks, Part 16: Air Interface for Fixed Broadband Wireless Access Systems,” 
http://standards.ieee.org/getieee802/download/802. 16-2004. pdf 


参考 文献 





[IEEE 802.16e 2005] IEEE, “IEEE Standard for Local and Metropolitan Area 
Networks, Part 16: Air Interface for Fixed and Mobile Broadband Wireless Access 
Systems, Amendment 2: Physical and Medium Access Control Layers for Com- 
bined Fixed and Mobile Operation in Licensed Bands and Corrigendum 1,” http:// 
standards. ieee.org/getieee802/download/802. 16e-2005.pdf 


[IEEE 802.1g 2005] IEEE, “IEEE Standard for Local and Metropolitan Area 
Networks: Virtual Bridged Local Area Networks,” http://standards.ieee.org/ 
getieee802/download/802. 1Q-2005.pdf 


[IEEE 802.1X] IEEE Std 802.1X-2001 Port-Based Network Access Control, 
http://standards.ieee.org/reading/ieee/std_public/description/lanman/ 
802.1x-2001_desc.html 


[IEEE 802.3 2012] IEEE, “IEEE 802.3 CSMA/CD (Ethernet),” http://grouper.ieee. 
org/groups/802/3/ 


[IEEE 802.5 2012] IEEE, IEEE 802.5 homepage, http://www.ieee802.org/5/ 
www802Sorg/ 


[IETF 2016] Internet Engineering Task Force homepage, http://www. ietf.org 


[Ihm 2011] S. Ihm, V. S. Pai, “Towards Understanding Modern Web Traffic,” 
Proc. 2011 ACM Internet Measurement Conference (Berlin). 


[IMAP 2012] The IMAP Connection, http://www.imap.org/ 


[Intel 2016] Intel Corp., “Intel 710 Ethernet Adapter,” http://www. intel.com/ 
content/www/us/en/ethernet-products/converged-network-adapters/ethernet-x17 10 
.html 


[Internet2 Multicast 2012] Internet2 Multicast Working Group homepage, http:// 
www.internet2.edu/multicast/ 


[ISC 2016] Internet Systems Consortium homepage, http://www.isc.org 


[ISI 1979] Information Sciences Institute, “DoD Standard Internet Protocol,” 
Internet Engineering Note 123 (Dec. 1979), http://www. isi.edu/in-notes/ien/ 
ien123.txt 


[ISO 2016] International Organization for Standardization homepage, International 
Organization for Standardization, http://www.iso.org/ 


[ISO X.680 2002] International Organization for Standardization, “X.680: ITU-T 
Recommendation X.680 (2002) Information Technology—Abstract Syntax Nota- 
tion One (ASN.1): Specification of Basic Notation,” http://www. itu.int/ITU-T/ 
studygroups/com17/languages/X.680-0207.pdf 


[ITU 1999] Asymmetric Digital Subscriber Line (ADSL) Transceivers. ITU-T 
G.992.1, 1999. 


[ITU 2003] Asymmetric Digital Subscriber Line (ADSL) Transceivers—Extended 
Bandwidth ADSL2 (ADSL2Plus). ITU-T G.992.5, 2003. 


[ITU 2005a] International Telecommunication Union, “ITU-T X.509, The Direc- 
tory: Public-key and attribute certificate frameworks” (Aug. 2005). 


[ITU 2006] ITU, “G.993.1: Very High Speed Digital Subscriber Line Transceivers 
(VDSL),” https://www.itu.int/rec/T-REC-G.993.1-200406-L/en, 2006. 


[ITU 2015] “Measuring the Information Society Report,” 2015, http://www. itu.int/ 
en/ITU-D/Statistics/Pages/publications/mis2015.aspx 


[ITU 2012] The ITU homepage, http://www. itu.int/ 
(ITU-T Q.2931 1995] International Telecommunication Union, “Recommendation 


49] 


492 


参考 文献 





Q.2931 (02/95) 一 Broadband Integrated Services Digital Network (B-ISDN)— 
Digital Subscriber Signalling System No. 2 (DSS 2)—User-Network Interface 
(UND 一 Layer 3 Specification for Basic Call/Connection Control.” 


[IXP List 2016] List of IXPs, Wikipedia, https://en.wikipedia.org/wiki/List_of_ 
Internet_exchange_points 


[Iyengar 2015] J. Iyengar, I. Swett, “QUIC: A UDP-Based Secure and Reliable 
Transport for HTTP/2,” Internet Draft draft-tsvwg-quic-protocol-00, June 2015. 


[Iyer 2008] S. Iyer, R. R. Kompella, N. McKeown, “Designing Packet Buffers for 
Router Line Cards,” JEEE Transactions on Networking, Vol. 16, No. 3 (June 2008), 
pp. 705-717. 


[Jacobson 1988] V. Jacobson, “Congestion Avoidance and Control,” Proc. 1988 
ACM SIGCOMM (Stanford, CA, Aug. 1988), pp. 314-329. 


[Jain 1986] R. Jain, “A Timeout-Based Congestion Control Scheme for Window 
Flow-Controlled Networks,” JEEE Journal on Selected Areas in Communications 
SAC-4, 7 (Oct. 1986). 


[Jain 1989] R. Jain, “A Delay-Based Approach for Congestion Avoidance in 
Interconnected Heterogeneous Computer Networks,” ACM SIGCOMM Computer 
Communications Review, Vol. 19, No. 5 (1989), pp. 56-71. 


[Jain 1994] R. Jain, FDDI Handbook: High-Speed Networking Using Fiber and 
Other Media, Addison-Wesley, Reading, MA, 1994. 


[Jain 1996] R. Jain. S. Kalyanaraman, S. Fahmy, R. Goyal, S. Kim, “Tutorial 
Paper on ABR Source Behavior,” ATM Forum/96-1270, Oct. 1996. http://www.cse. 
wustl.edu/~jain/atmf/ftp/atm96-1270.pdf 


[Jain 2013] S. Jain, A. Kumar, S. Mandal, J. Ong, L. Poutievski, A. Singh, 
S.Venkata, J. Wanderer, J. Zhou, M. Zhu, J. Zolla, U. Hölzle, S. Stuart, A, Vahdat, 
“B4: Experience with a Globally Deployed Software Defined Wan,” ACM 
SIGCOMM 2013, pp. 3-14. 


[Jaiswal 2003] S. Jaiswal, G. Iannaccone, C. Diot, J. Kurose, D. Towsley, “Mea- 
surement and Classification of Out-of-Sequence Packets in a Tier-1 IP backbone,” 
Proc. 2003 IEEE INFOCOM. 


[Ji 2003] P. Ji, Z. Ge, J. Kurose, D. Towsley, “A Comparison of Hard-State and 
Soft-State Signaling Protocols,” Proc. 2003 ACM SIGCOMM (Karlsruhe, Ger- 
many, Aug. 2003). 


[Jimenez 1997] D. Jimenez, “Outside Hackers Infiltrate MIT Network, Compro- 
mise Security,” The Tech, Vol. 117, No 49 (Oct. 1997), p. 1, http://www-tech.mit. 
edu/V 117/N49/hackers.49n.html 


[Jin 2004] C. Jin, D. X. We, S. Low, “FAST TCP: Motivation, Architecture, 
Algorithms, Performance,” Proc. 2004 IEEE INFOCOM (Hong Kong, 
Mar. 2004). 


[Juniper Contrail 2016] Juniper Networks, “Contrail,” http://www.juniper.net/us/ 
en/products-services/sdn/contrail/ 


[Juniper MX2020 2015] Juniper Networks, “MX2020 and MX2010 3D Universal 
Edge Routers,” www.juniper.net/us/en/local/pdf/.../1000417-en.pdf 


[Kaaranen 2001] H. Kaaranen, S. Naghian, L. Laitinen, A. Ahtiainen, V. Niemi, 
Networks: Architecture, Mobility and Services, New York: John Wiley & Sons, 
2001. 


[Kahn 1967] D. Kahn, The Codebreakers: The Story of Secret Writing, The 
Macmillan Company, 1967. 


参考 文献 


[Kahn 1978] R. E. Kahn, S. Gronemeyer, J. Burchfiel, R. Kunzelman, 
“Advances in Packet Radio Technology,” Proc. 1978 IEEE INFOCOM, 66, 11 
(Nov. 1978). 


[Kamerman 1997] A. Kamerman, L. Monteban, “WaveLAN-II: A High- 
Performance Wireless LAN for the Unlicensed Band,” Bell Labs Technical Journal 
(Summer 1997), pp- 118-133. 


[Kar 2000] K. Kar, M. Kodialam, T. V. Lakshman, “Minimum Interference Rout- 
ing of Bandwidth Guaranteed Tunnels with MPLS Traffic Engineering Applica- 
tions,” JEEE J. Selected Areas in Communications (Dec. 2000). 


[Karn 1987] P. Karn, C. Partridge, “Improving Round-Trip Time Estimates in 
Reliable Transport Protocols,” Proc. 1987 ACM SIGCOMM. 


[Karol 1987] M. Karol, M. Hluchyj, A. Morgan, “Input Versus Output Queuing on 
a Space-Division Packet Switch,” JEEE Transactions on Communications, Vol. 35, 
No. 12 (Dec.1987), pp. 1347-1356. 


[Kaufman 1995] C. Kaufman, R. Perlman, M. Speciner, Network Security, Private 
Communication in a Public World, Prentice Hall, Englewood Cliffs, NJ, 1995. 


[Kelly 1998] F. P. Kelly, A. Maulloo, D. Tan, “Rate Control for Communication 
Networks: Shadow Prices, Proportional Fairness and Stability,” J. Operations Res. 
Soc., Vol. 49, No. 3 (Mar. 1998), pp. 237-252. 


[Kelly 2003] T. Kelly, “Scalable TCP: Improving Performance in High Speed 
Wide Area 

Networks,” ACM SIGCOMM Computer Communications Review, Volume 33, No. 
2 (Apr. 2003), pp 83-91. 


[Kilkki 1999] K. Kilkki, Differentiated Services for the Internet, Macmillan Tech- 
nical Publishing, Indianapolis, IN, 1999, 


[Kim 2005] H. Kim, S. Rixner, V. Pai, “Network Interface Data Caching,” JEEE 
Transactions on Computers, Vol. 54, No. 11 (Nov. 2005), pp. 1394-1408. 


[Kim 2008] C. Kim, M. Caesar, J. Rexford, “Floodless in SEATTLE: A Scalable 
Ethernet Architecture for Large Enterprises,” Proc. 2008 ACM SIGCOMM (Se- 
attle, WA, Aug. 2008). 


[Kleinrock 1961] L. Kleinrock, “Information Flow in Large Communication Net- 
works,” RLE Quarterly Progress Report, July 1961. 


[Kleinrock 1964] L. Kleinrock, 1964 Communication Nets: Stochastic Message 
Flow and Delay, McGraw-Hill, New York, NY, 1964. 


[Kleinrock 1975] L. Kleinrock, Queuing Systems, Vol. 1, John Wiley, New York, 
1975. 


[Kleinrock 1975b] L. Kleinrock, F. A. Tobagi, “Packet Switching in Radio Chan- 
nels: Part I—Carrier Sense Multiple-Access Modes and Their Throughput-Delay 
Characteristics,” JEEE Transactions on Communications, Vol. 23, No. 12 (Dec. 
1975), pp. 1400-1416. 


[Kleinrock 1976] L. Kleinrock, Queuing Systems, Vol. 2, John Wiley, New York, 
1976. 


[Kleinrock 2004] L. Kleinrock, “The Birth of the Internet,” http://www.lk.cs.ucla. 
edu/LK/Inev/birth.html 


[Kohler 2006] E. Kohler, M. Handley, S. Floyd, “DDCP: Designing DCCP: 
Congestion Control Without Reliability,” Proc. 2006 ACM SIGCOMM (Pisa, Italy, 
Sept. 2006). 


493 


494 


参考 文献 





[Kolding 2003] T. Kolding, K. Pedersen, J. Wigard, F. Frederiksen, P. Mogensen, 
“High Speed Downlink Packet Access: WCDMA Evolution,” IEEE Vehicular 
Technology Society News (Feb. 2003), pp. 4-10. 


[Koponen 2010] T. Koponen, M. Casado, N. Gude, J. Stribling, L. Poutievski, 
M. Zhu, R. Ramanathan, Y. Iwata, H. Inoue, T. Hama, S. Shenker, “Onix: A 
Distributed Control Platform for Large-Scale Production Networks,” 9th USENIX 
conference on Operating systems design and implementation (OSDI’10), pp. 1—6. 


[Koponen 2011] T. Koponen, S. Shenker, H. Balakrishnan, N. Feamster, I. 
Ganichev, A. Ghodsi, P. B. Godfrey, N. McKeown, G. Parulkar, B. Raghavan, J. 
Rexford, S. Arianfar, D. Kuptsov, “Architecting for Innovation,” ACM Computer 
Communications Review, 2011. 


[Korhonen 2003] J. Korhonen, Introduction to 3G Mobile Communications, 2nd 
ed., Artech House, 2003. 


[Koziol 2003] J. Koziol, Intrusion Detection with Snort, Sams Publishing, 2003. 


[Kreutz 2015] D. Kreutz, F.M.V. Ramos, P. Esteves Verissimo, C. Rothenberg, 
S. Azodolmolky, S. Uhlig, “Software-Defined Networking: A Comprehensive 
Survey,” Proceedings of the IEEE, Vol. 103, No. 1 (Jan. 2015), pp. 14-76. 

This paper is also being updated at https://github.com/SDN-Survey/latex/wiki 


[Krishnamurthy 2001] B. Krishnamurthy, J. Rexford, Web Protocols and Prac- 
tice: HTTP/ 1.1, Networking Protocols, and Traffic Measurement, Addison-Wes- 
ley, Boston, MA, 2001. 


[Kulkarni 2005] S. Kulkarni, C: Rosenberg, “Opportunistic Scheduling: General- 
izations to Include Multiple Constraints, Multiple Interfaces, and Short Term Fair- 
ness,” Wireless Networks, 11 (2005), 557-569. 


[Kumar 2006] R. Kumar, K.W. Ross, “Optimal Peer-Assisted File Distribution: 
Single and Multi-Class Problems,” JEEE Workshop on Hot Topics in Web Systems 
and Technologies (Boston, MA, 2006). 


[Labovitz 1997] C. Labovitz, G. R. Malan, F. Jahanian, “Internet Routing Instabil- 
ity,” Proc. 1997 ACM SIGCOMM (Cannes, France, Sept. 1997), pp. 115-126. 


[Labovitz 2010] C. Labovitz, S. lekel-Johnson, D. McPherson, J. Oberheide, F. 
Jahanian, “Internet Inter-Domain Traffic,” Proc. 2010 ACM SIGCOMM. 


[Labrador 1999] M. Labrador, S. Banerjee, “Packet Dropping Policies for ATM 
and IP Networks,” IEEE Communications Surveys, Vol. 2, No. 3 (Third Quarter 
1999), pp. 2-14. 


[Lacage 2004] M. Lacage, M.H. Manshaei, T. Turletti, “IEEE 802,11 Rate Adapta- 
tion: A Practical Approach,” ACM Int. Symposium on Modeling, Analysis, and 
Simulation of Wireless and Mobile Systems (MSWiM) (Venice, Italy, Oct. 2004). 


[Lakhina 2004] A. Lakhina, M. Crovella, C. Diot, “Diagnosing Network-Wide 
Traffic Anomalies,” Proc. 2004 ACM SIGCOMM. 


[Lakhina 2005] A. Lakhina, M. Crovella, C. Diot, “Mining Anomalies Using Traf- 
fic Feature Distributions,” Proc. 2005 ACM SIGCOMM. 


[Lakshman 1997] T. V. Lakshman, U. Madhow, “The Performance of TCP/IP for 
Networks with High Bandwidth-Delay Products and Random Loss,” JEEE/ACM 
Transactions on Networking, Vol. 5, No. 3 (1997), pp. 336-350. 


[Lakshman 2004] T. V. Lakshman, T. Nandagopal, R. Ramjee, K. Sabnani, T. , 
Woo, “The SoftRouter Architecture,” Proc. 3nd ACM Workshop on Hot Topics in 
Networks (Hotnets-III), Nov. 2004. 


[Lam 1980] S. Lam, “A Carrier Sense Multiple Access Protocol for Local Net- 


参考 文献 





works,” Computer Networks, Vol. 4 (1980), pp. 21-32. 


[Lamport 1989] L. Lamport, “The Part-Time Parliament,” Technical Report 49, 
Systems Research Center, Digital Equipment Corp., Palo Alto, Sept. 1989. 


[Lampson 1983] Lampson, Butler W. “Hints for computer system design,” ACM 
SIGOPS Operating Systems Review, Vol. 17, No. 5, 1983. 


[Lampson 1996] B. Lampson, “How to Build a Highly Available System Using 
Consensus,” Proc. 10th International Workshop on Distributed Algorithms (WDAG 
"96), Özalp Babaoglu and Keith Marzullo (Eds.), Springer-Verlag, pp. 1-17. 


[Lawton 2001] G. Lawton, “Is IPv6 Finally Gaining Ground?” JEEE Computer 
Magazine (Aug. 2001), pp. 11-15. 


[LeBiond 2011] S. Le Blond, C. Zhang, A. Legout, K. Ross, W. Dabbous. 2011, 
“I know where you are and what you are sharing: exploiting P2P communications 
to invade users’ privacy.” 2011 ACM Internet Measurement Conference, ACM, 
New York, NY, USA, pp. 45—60. 


[Leighton 2009] T. Leighton, “Improving Performance on the Internet,” Communi- 
cations of the ACM, Vol. 52, No. 2 (Feb. 2009), pp. 44-51. 


[Leiner 1998] B. Leiner, V. Cerf, D. Clark, R. Kahn, L. Kleinrock, D. Lynch, J. 
Postel, L. Roberts, S. Woolf, “A Brief History of the Internet,” http://www.isoc. 
org/internet/history/brief.html 


[Leung 2006] K. Leung, V. O.K. Li, “TCP in Wireless Networks: Issues, 
Approaches, and Challenges,” JEEE Commun. Surveys and Tutorials, Vol. 8, No. 4 
(2006), pp. 64-79. 


[Levin 2012] D. Levin, A. Wundsam, B. Heller, N. Handigol, A. Feldmann, “Logi- 
cally Centralized?: State Distribution Trade-offs in Software Defined Networks,” 
Proc. First Workshop on Hot Topics in Software Defined Networks (Aug. 2012), 
pp. 1-6. 


[Li 2004] L. Li, D. Alderson, W. Willinger, J. Doyle, “A First-Principles Approach 
to Understanding the Internet’s Router-Level Topology,” Proc. 2004 ACM SIG- 
COMM (Portland, OR, Aug. 2004). 


[Li 2007] J. Li, M. Guidero, Z. Wu, E. Purpus, T. Ehrenkranz, “BGP Routing 
Dynamics Revisited.” ACM Computer Communication Review (Apr. 2007). 


[Li 2015] S.Q. Li, “Building Softcom Ecosystem Foundation,” Open Networking 
Summit, 2015. 


[Lin 2001] Y. Lin, I. Chlamtac, Wireless and Mobile Network Architectures, John 
Wiley and Sons, New York, NY, 2001. 


[Liogkas 2006] N. Liogkas, R. Nelson, E. Kohler, L. Zhang, “Exploiting BitTor- 
rent for Fun (but Not Profit),” 6th International Workshop on Peer-to-Peer Systems 
(IPTPS 2006). 


[Liu 2003] J. Liu, I. Matta, M. Crovella, “End-to-End Inference of Loss Nature in 
a Hybrid Wired/Wireless Environment,” Proc. WiOpt’03: Modeling and Optimiza- 
tion in Mobile, Ad Hoc and Wireless Networks. 


[Locher 2006] T. Locher, P. Moor, S. Schmid, R. Wattenhofer, “Free Riding in 
BitTorrent is Cheap,” Proc. ACM HotNets 2006 (Irvine CA, Nov. 2006). 


[Lui 2004] J. Lui, V. Misra, D. Rubenstein, “On the Robustness of Soft State Pro- 
tocols,” Proc. IEEE Int. Conference on Network Protocols (ICNP ’04), pp. 50-60. 


[Mahdavi 1997] J. Mahdavi, S. Floyd, “TCP-Friendly Unicast Rate-Based Flow 
Control,” unpublished note (Jan. 1997). 


495 


496 


参考 文献 





[MaxMind 2016] http://www.maxmind.com/app/ip-location 


[Maymounkoy 2002] P. Maymounkov, D. Mazières. “Kademlia: A Peer-to-Peer 
Information System Based on the XOR Metric.” Proceedings of the Ist Interna- 
tional Workshop on Peerto-Peer Systems (IPTPS ‘02) (Mar. 2002), pp. 53-65. 


[McKeown 1997a] N. McKeown, M. Izzard, A. Mekkittikul, W. Ellersick, M. 
Horowitz, “The Tiny Tera: A Packet Switch Core,” IEEE Micro Magazine 
(Jan.—Feb. 1997). 


[McKeown 1997b] N. McKeown, “A Fast Switched Backplane for a Gigabit 
Switched Router,” Business Communications Review, Vol. 27, No. 12. http://tiny- 
tera.stanford.edu/~nickm/papers/cisco_fasts_wp.pdf 


[McKeown 2008] N. McKeown, T. Anderson, H. Balakrishnan, G. Parulkar, 

L. Peterson, J. Rexford, S. Shenker, J. Turner. 2008. OpenFlow: Enabling Innova- 
tion in Campus Networks. SIGCOMM Comput. Commun. Rev. 38, 2 (Mar. 2008), 
pp. 69-74. 


[McQuillan 1980] J. McQuillan, I. Richer, E. Rosen, “The New Routing Algo- 
rithm for the Arpanet,” JEEE Transactions on Communications, Vol. 28, No. 5 
(May 1980), pp. 711-719. 


[Metcalfe 1976] R. M. Metcalfe, D. R. Boggs. “Ethernet: Distributed Packet 
Switching for Local Computer Networks,” Communications of the Association for 
Computing Machinery, Vol. 19, No. 7 (July 1976), pp. 395-404. 


[Meyers 2004] A. Myers, T. Ng, H. Zhang, “Rethinking the Service Model: Scal- 
ing Ethernet to a Million Nodes,” ACM Hotnets Conference, 2004. 


[MFA Forum 2016] IP/MPLS Forum homepage, http://www.ipmplsforum.org/ 


[Mockapetris 1988] P. V. Mockapetris, K. J. Dunlap, “Development of the Do- 
main Name System,” Proc. 1988 ACM SIGCOMM (Stanford, CA, Aug. 1988). 


[Mockapetris 2005] P. Mockapetris, Sigcomm Award Lecture, video available at 
http://www. postel.org/sigcomm 


[Molinero-Fernandez 2002] P. Molinaro-Fernandez, N. McKeown, H. Zhang, 
“Is IP'Going to Take Over the World (of Communications)?” Proc. 2002 ACM 
Hotnets. 


[Molle 1987] M. L. Molle, K. Sohraby, A. N. Venetsanopoulos, “Space-Time 
Models of Asynchronous CSMA Protocols for Local Area Networks,” JEEE Jour- 
nal on Selected Areas in Communications, Vol. 5, No. 6 (1987), pp. 956-968. 


[Moore 2001] D. Moore, G. Voelker, S. Savage, “Inferring Internet Denial of Ser- 
vice Activity,” Proc. 200] USENIX Security Symposium (Washington, DC, Aug. 
2001). 


[Motorola 2007] Motorola, “Long Term Evolution (LTE): A Technical Overview,” 
http://www.motorola.com/staticfiles/Business/Solutions/Industry %20Solu- 
tions/Service%20Providers/Wireless%20Operators/LTE/_Document/Static%20 
Files/6834_MotDoc_New.pdf 


[Mouly 1992] M. Mouly, M. Pautet, The GSM System for Mobile Communications, 
Cell and Sys, Palaiseau, France, 1992. 


[Moy 1998] J. Moy, OSPF: Anatomy of An Internet Routing Protocol, Addison- 
Wesley, Reading, MA, 1998. 


[Mukherjee 1997] B. Mukherjee, Optical Communication Networks, McGraw- 
Hill, 1997. 
[Mukherjee 2006] B. Mukherjee, Optical WDM Networks, Springer, 2006. 


[Mysore 2009] R. N. Mysore, A. Pamboris, N. Farrington, N. Huang, P. Miri, 
S. Radhakrishnan, V. Subramanya, A. Vahdat, “PortLand: A Scalable Fault- 
Tolerant Layer 2 Data Center Network Fabric,” Proc. 2009 ACM SIGCOMM. 


参考 文献 


497 





[Nahum 2002] E. Nahum, T. Barzilai, D. Kandlur, “Performance Issues in WWW 
Servers,” IEEE/ACM Transactions on Networking, Vol 10, No. 1 (Feb. 2002). 


[Netflix Open Connect 2016] Netflix Open Connect CDN, 2016, https:// 
openconnect.netflix.com/ 


[Netflix Video 1] Designing Netflix’s Content Delivery System, D. Fulllager, 
2014, https://www.youtube.com/watch?v=LkLLpYdDINA 


[Netflix Video 2] Scaling the Netflix Global CDN, D. Temkin, 2015, https://www 
-youtube.com/watch?v=tbqcsHg-Q_o 


[Neumann 1997] R. Neumann, “Internet Routing Black Hole,” The Risks Digest: 
Forum on Risks to the Public in Computers and Related Systems, Vol. 19, No. 12 
(May 1997). http://catless.ncl.ac.uk/Risks/19.12.html#subj1.1 


[Neville-Neil 2009] G. Neville-Neil, “Whither Sockets?” Communications of the 
ACM, Vol. 52, No. 6 (June 2009), pp. 51-55. 


[Nicholson 2006] A Nicholson, Y. Chawathe, M. Chen, B. Noble, D. Wetherall, 
“Improved Access Point Selection,” Proc. 2006 ACM Mobisys Conference 
(Uppsala Sweden, 2006). 


[Nielsen 1997] H. F. Nielsen, J. Gettys, A. Baird-Smith, E. Prud’hommeaux, H. W. 
Lie, C, Lilley, “Network Performance Effects of HTTP/1.1, CSS1, and PNG,” W3C 
Document, 1997 (also appears in Proc. 1997 ACM SIGCOM (Cannes, France, Sept 

1997), pp. 155-166. 


[NIST 2001] National Institute of Standards and Technology, “Advanced Encryp- 
tion Standard (AES),” Federal Information Processing Standards 197, Nov. 2001, 
http://csrc.nist.gov/publications/fips/fips 197/fips-197.pdf 


[NIST IPv6 2015] US National Institute of Standards and Technology, “Estimating 
IPv6 & DNSSEC Deployment SnapShots,” http://fedv6-deployment.antd.nist.gov/ 
snap-all.html 


[Nmap 2012] Nmap homepage, http://www.insecure.com/nmap 


[Nonnenmacher 1998] J. Nonnenmacher, E. Biersak, D. Towsley, “Parity-Based 
Loss Recovery for Reliable Multicast Transmission,” JEEE/ACM Transactions on 
Networking, Vol. 6, No. 4 (Aug. 1998), pp. 349-361. 


[Nygren 2010] Erik Nygren, Ramesh K. Sitaraman, and Jennifer Sun, “The Aka- 
mai Network: A Platform for High-performance Internet Applications,” SIGOPS 
Oper. Syst. Rev. 44, 3 (Aug. 2010), 2-19. 


[ONF 2016] Open Networking Foundation, Technical Library, https://www.open- 
networking.org/sdn-resources/technical-library 


[ONOS 2016] Open Network Operating System (ONOS), “Architecture Guide,” 
https://wiki.onosproject.org/display/ONOS/Architecture+Guide, 2016. 


[OpenFlow 2009] Open Network Foundation, “OpenFlow Switch Specification 
1.0.0, TS-001,” https://www.opennetworking.org/images/stories/downloads/sdn- 
resources/onf-specifications/openflow/openflow-spec-v 1.0.0.pdf 


[OpenDaylight Lithium 2016] OpenDaylight, “Lithium,” https://www.openday- 
light.org/lithium 

[OSI 2012] International Organization for Standardization homepage, http://www. 
iso.org/iso/en/ISOOnline. frontpage 


[Osterweil 2012] E. Osterweil, D. McPherson, S. DiBenedetto, C. Papadopoulos, D. 
Massey, “Behavior of DNS Top Talkers,” Passive and Active Measurement Confer- 
ence, 2012. 


498 


参考 文献 





[Padhye 2000] J. Padhye, V. Firoiu, D. Towsley, J. Kurose, “Modeling TCP Reno 
Performance: A Simple Model and Its Empirical Validation,” IEEE/ACM Transac- 
tions on Networking, Vol. 8 No. 2 (Apr. 2000), pp. 133-145. 


[Padhye 2001] J. Padhye, S. Floyd, “On Inferring TCP Behavior,” Proc. 2001 
ACM SIGCOMM (San Diego, CA, Aug. 2001). 


[Palat 2009] S. Palat, P. Godin, “The LTE Network Architecture: A Comprehensive 
Tutorial,” in LTE—The UMTS Long Term Evolution: From Theory to Practice. 
Also available as a standalone Alcatel white paper. 


[Panda 2013] A. Panda, C. Scott, A. Ghodsi, T. Koponen, S. Shenker, “CAP for 
Networks,” Proc. ACM HotSDN ’13, pp. 91-96. 


[Parekh 1993] A. Parekh, R. Gallagher, “A Generalized Processor Sharing Ap- 
proach to Flow Control in Integrated Services Networks: The Single-Node Case,” 
IEEE/ACM Transactions on Networking, Vol. 1, No. 3 (June 1993), pp. 344-357. 


[Partridge 1992] C. Partridge, S. Pink, “An Implementation of the Revised Internet 
Stream Protocol (ST-2),” Journal of Internetworking: Research and Experience, Vol. 3, 
No. 1 (Mar. 1992). 


[Partridge 1998] C. Partridge, et al. “A Fifty Gigabit per second IP Router,” JEEE/ 
ACM Transactions on Networking, Vol. 6, No. 3 (Jun. 1998), pp. 237-248. 


[Pathak 2010] A. Pathak, Y. A. Wang, C. Huang, A. Greenberg, Y. C. Hu, J. Li, 
K. W. Ross, “Measuring and Evaluating TCP Splitting for Cloud Services,” Pas- 
sive and Active Measurement (PAM) Conference (Zurich, 2010). 


[Perkins 1994] A. Perkins, “Networking with Bob Metcalfe,” The Red Herring 
Magazine (Nov. 1994). 


[Perkins 1998] C. Perkins, O. Hodson, V. Hardman, “A Survey of Packet Loss 
Recovery Techniques for Streaming Audio,” JEEE Network Magazine (Sept./Oct. 
1998), pp. 40-47. 


[Perkins 1998b] C. Perkins, Mobile IP: Design Principles and Practice, Addison- 
Wesley, Reading, MA, 1998. 


[Perkins 2000] C. Perkins, Ad Hoc Networking, Addison-Wesley, Reading, MA, 
2000. 


[Perlman 1999] R. Perlman, /nterconnections: Bridges, Routers, Switches, and In- 
ternetworking Protocols, 2nd ed., Addison-Wesley Professional Computing Series, 
Reading, MA, 1999, 


[PGPI 2016] The International PGP homepage, http://www.pgpi.org 


[Phifer 2000] L. Phifer, “The Trouble with NAT,” The Internet Protocol Journal, 
Vol. 3, No. 4 (Dec. 2000), http://www.cisco.com/warp/public/759/ipj_3-4/ipj_ 
3-4_nat.html 


[Piatek 2007] M. Piatek, T. Isdal, T. Anderson, A. Krishnamurthy, A. Venkataram- 
ani, “Do Incentives Build Robustness in Bittorrent?,” Proc. NSDI (2007). 


[Piatek 2008] M. Piatek, T. Isdal, A. Krishnamurthy, T. Anderson, “One Hop 
Reputations for Peer-to-peer File Sharing Workloads,” Proc. NSDI (2008). 


[Pickholtz 1982] R. Pickholtz, D. Schilling, L. Milstein, “Theory of Spread Spec- 
trum Communication—a Tutorial,” JEEE Transactions on Communications, Vol. 
30, No. 5 (May 1982), pp. 855-884. 


[PingPlotter 2016] PingPlotter homepage, http://www.pingplotter.com 


[Piscatello 1993] D. Piscatello, A. Lyman Chapin, Open Systems Networking, 
Addison-Wesley, Reading, MA, 1993. 


参考 文献 





499 





[Pomeranz 2010] H. Pomeranz, “Practical, Visual, Three-Dimensional Pedagogy 
for Internet Protocol Packet Header Control Fields,” https://righteousit.wordpress. 
com/2010/06/27/practical-visual-three-dimensional-pedagogy-for-internet-proto- 

col-packet-header-control-fields/, June 2010. 


[Potaroo 2016] “Growth of the BGP Table—1994 to Present,” http://bgp.potaroo. 
net/ 


[PPLive 2012] PPLive homepage, http://www.pplive.com 


[Qazi 2013] Z. Qazi, C. Tu, L. Chiang, R. Miao, V. Sekar, M. Yu, “SIMPLE-fying 
Middlebox Policy Enforcement Using SDN,” ACM SIGCOMM Conference 
(Aug. 2013), pp. 27-38. 


[Quagga 2012] Quagga, “Quagga Routing Suite,” http://www.quagga.net/ 


[Quittner 1998] J. Quittner, M. Slatalla, Speeding the Net: The Inside Story of 
Netscape and How It Challenged Microsoft, Atlantic Monthly Press, 1998. 


[Quova 2016] www.quova.com 


[Ramakrishnan 1990] K. K. Ramakrishnan, R. Jain, “A Binary Feedback Scheme 
for Congestion Avoidance in Computer Networks,” ACM Transactions on Com- 
puter Systems, Vol. 8, No. 2 (May 1990), pp. 158-181. 


[Raman 1999] S. Raman, S. McCanne, “A Model, Analysis, and Protocol Frame- 
work for Soft State-based Communication,” Proc. 1999 ACM SIGCOMM (Boston, 
MA, Aug. 1999). 


[Raman 2007] B. Raman, K. Chebrolu, “Experiences in Using WiFi for Rural In- 
ternet in India,” JEEE Communications Magazine, Special Issue on New Directions 
in Networking Technologies in Emerging Economies (Jan. 2007). 


[Ramaswami 2010] R. Ramaswami, K. Sivarajan, G. Sasaki, Optical Networks: A 
Practical Perspective, Morgan Kaufman Publishers, 2010. 


[Ramjee 1994] R. Ramjee, J. Kurose, D. Towsley, H. Schulzrinne, “Adaptive 
Playout Mechanisms for Packetized Audio Applications in Wide-Area Networks,” 
Proc. 1994 IEEE INFOCOM. 


[Rao 2011] A. S. Rao, Y. S. Lim, C. Barakat, A. Legout, D. Towsley, W. Dabbous, 
“Network Characteristics of Video Streaming Traffic,” Proc. 2011 ACM CoNEXT 
(Tokyo). 


[Ren 2006] S. Ren, L. Guo, X. Zhang, “ASAP: An AS-Aware Peer-Relay Protocol 
for High Quality VoIP,” Proc. 2006 IEEE ICDCS (Lisboa, Portugal, July 2006). 


[Rescorla 2001] E. Rescorla, SSL and TLS: Designing and Building Secure Sys- 
tems, Addison-Wesley, Boston, 2001. 


[RFC 001] S. Crocker, “Host Software,” RFC 001 (the very first RFC!). 
[RFC 768] J. Postel, “User Datagram Protocol,” RFC 768, Aug. 1980. 


[RFC 791] J. Postel, “Internet Protocol: DARPA Internet Program Protocol Speci- 
fication,” RFC 791, Sept. 1981. 


[RFC 792] J. Postel, “Internet Control Message Protocol,” RFC 792, Sept. 1981. 
[RFC 793] J. Postel, “Transmission Control Protocol,” RFC 793, Sept. 1981. 
[RFC 801] J. Postel, “NCP/TCP Transition Plan,” RFC 801, Nov. 1981. 


[RFC 826] D. C. Plummer, “An Ethernet Address Resolution Protocol—or— 
Converting Network Protocol Addresses to 48-bit Ethernet Address for Transmis- 
sion on Ethernet Hardware,” RFC 826, Nov. 1982. 


500 


参考 文献 





[RFC 829] V. Cerf, “Packet Satellite Technology Reference Sources,” RFC 829, 
Noy. 1982. 


[RFC 854] J. Postel, J. Reynolds, “TELNET Protocol Specification,” RFC 854, 
May 1993. 


[RFC 950] J. Mogul, J. Postel, “Internet Standard Subnetting Procedure,” RFC 
950, Aug. 1985. 


[RFC 959] J. Postel and J. Reynolds, “File Transfer Protocol (FTP),” RFC 959, 
Oct. 1985. 


[RFC 1034] P. V. Mockapetris, “Domain Names—Concepts and Facilities,” RFC 
1034, Nov. 1987. 


[RFC 1035] P. Mockapetris, “Domain Names—Implementation and Specifica- 
tion,” RFC 1035, Nov. 1987. 


[RFC 1058] C. L. Hendrick, “Routing Information Protocol,” RFC 1058, June 
1988. 


[RFC 1071] R. Braden, D. Borman, and C. Partridge, “Computing the Internet 
Checksum,” RFC 1071, Sept. 1988. 


[RFC 1122] R. Braden, “Requirements for Internet Hosts—Communication 
Layers,” RFC 1122, Oct. 1989. 


[RFC 1123] R. Braden, ed., “Requirements for Internet Hosts—Application and 
Support,” RFC-1123, Oct. 1989. 


[RFC 1142] D. Oran, “OSI IS-IS Intra-Domain Routing Protocol,” RFC 1142, 
Feb. 1990. 


[RFC 1190] C. Topolcic, “Experimental Internet Stream Protocol: Version 2 
(ST-IT),” RFC 1190, Oct. 1990. 


[RFC 1256] S. Deering, “ICMP Router Discovery Messages,” RFC 1256, Sept. 
1991. 


[RFC 1320] R. Rivest, “The MD4 Message-Digest Algorithm,” RFC 1320, Apr. 
1992. 


[RFC 1321] R. Rivest, “The MD5 Message-Digest Algorithm,” RFC 1321, Apr. 
1992. 


[RFC 1323] V. Jacobson, S. Braden, D. Borman, “TCP Extensions for High Per- 
formance,” RFC 1323, May 1992. 


[RFC 1422] S. Kent, “Privacy Enhancement for Internet Electronic Mail: Part II: 
Certificate-Based Key Management,” RFC 1422. 


[RFC 1546] C. Partridge, T. Mendez, W. Milliken, “Host Anycasting Service,” 
RFC 1546, 1993. 


[RFC 1584] J. Moy, “Multicast Extensions to OSPF,” RFC 1584, Mar. 1994. 


[RFC 1633] R. Braden, D. Clark, S. Shenker, “Integrated Services in the Internet 
Architecture: an Overview,” RFC 1633, June 1994. 


[RFC 1636] R. Braden, D. Clark, S. Crocker, C. Huitema, “Report of IAB Work- 
shop on Security in the Internet Architecture,” RFC 1636, Nov. 1994. 


[RFC 1700] J. Reynolds, J. Postel, “Assigned Numbers,” RFC 1700, Oct. 1994. 


[RFC 1752] S. Bradner, A. Mankin, “The Recommendations for the IP Next Gen- 
eration Protocol,” RFC 1752, Jan. 1995. 


[RFC 1918] Y. Rekhter, B. Moskowitz, D. Karrenberg, G. J. de Groot, E. Lear, 


参考 文献 





“Address Allocation for Private Internets,” RFC 1918, Feb. 1996. 


[RFC 1930] J. Hawkinson, T. Bates, “Guidelines for Creation, Selection, and Reg- 
istration of an Autonomous System (AS),” RFC 1930, Mar. 1996. 


[RFC 1939] J. Myers, M. Rose, “Post Office Protocol—Version 3,” RFC 1939, 
May 1996. 


[RFC 1945] T. Berners-Lee, R. Fielding, H. Frystyk, “Hypertext Transfer Proto- 
col—HTTP/1.0,” RFC 1945, May 1996. 


[RFC 2003] C. Perkins, “IP Encapsulation Within IP,” RFC 2003, Oct. 1996. 


[RFC 2004] C. Perkins, “Minimal Encapsulation Within IP,” RFC 2004, Oct. 
1996. 


[RFC 2018] M. Mathis, J. Mahdavi, S. Floyd, A. Romanow, “TCP Selective 
Acknowledgment Options,” RFC 2018, Oct. 1996. 


[RFC 2131] R. Droms, “Dynamic Host Configuration Protocol,” RFC 2131, Mar. 
1997. 


[RFC 2136] P. Vixie, S. Thomson, Y. Rekhter, J. Bound, “Dynamic Updates in the 
Domain Name System,” RFC 2136, Apr. 1997. 


[RFC 2205] R. Braden, Ed., L. Zhang, S. Berson, S. Herzog, S. Jamin, “Resource 
ReSerVation Protocol (RSVP)—Version 1 Functional Specification,” RFC 2205, 
Sept. 1997. 


[RFC 2210] J. Wroclawski, “The Use of RSVP with IETF Integrated Services,” 
RFC 2210, Sept. 1997. 


[RFC 2211] J. Wroclawski, “Specification of the Controlled-Load Network Ele- 
ment Service,” RFC 2211, Sept. 1997. 


[RFC 2215] S. Shenker, J. Wroclawski, “General Characterization Parameters for 
Integrated Service Network Elements,” RFC 2215, Sept. 1997. 


[RFC 2326] H. Schulzrinne, A. Rao, R. Lanphier, “Real Time Streaming Protocol 
(RTSP),” RFC 2326, Apr. 1998. 


[RFC 2328] J. Moy, “OSPF Version 2,” RFC 2328, Apr. 1998. 


[RFC 2420] H. Kummert, “The PPP Triple-DES Encryption Protocol (3DESE),” 
RFC 2420, Sept. 1998. 


[RFC 2453] G. Malkin, “RIP Version 2,” RFC 2453, Nov. 1998. 


[RFC 2460] S. Deering, R. Hinden, “Internet Protocol, Version 6 (IPv6) Specifica- 
tion,” RFC 2460, Dec. 1998. 


[RFC 2475] S. Blake, D. Black, M. Carlson, E. Davies, Z. Wang, W. Weiss, “An 
Architecture for Differentiated Services,” RFC 2475, Dec. 1998. 


[RFC 2578] K. McCloghrie, D. Perkins, J. Schoenwaelder, “Structure of Manage- 
ment Information Version 2 (SMIv2),” RFC 2578, Apr. 1999. 


[RFC 2579] K. McCloghrie, D. Perkins, J. Schoenwaelder, “Textual Conventions 
for SMIv2,” RFC 2579, Apr. 1999. 


[RFC 2580] K. McCloghrie, D. Perkins, J. Schoenwaelder, “Conformance State- 
ments for SMIv2,” RFC 2580, Apr. 1999. 


[RFC 2597] J. Heinanen, F. Baker, W. Weiss, J. Wroclawski, “Assured Forward- 
ing PHB Group,” RFC 2597, June 1999. 


[RFC 2616] R. Fielding, J. Gettys, J. Mogul, H. Frystyk, L. Masinter, P. Leach, T. 
Berners-Lee, R. Fielding, “Hypertext Transfer Protocol—HTTP/1.1,” RFC 2616, 


501 


502 


参考 文献 





June 1999, 


[RFC 2663] P. Srisuresh, M. Holdrege, “IP Network Address Translator (NAT) 
Terminology and Considerations,” RFC 2663. 


[RFC 2702] D. Awduche, J. Malcolm, J. Agogbua, M. O’ Dell, J. McManus, “Re- 
quirements for Traffic Engineering Over MPLS,” RFC 2702, Sept. 1999. 


[RFC 2827] P. Ferguson, D. Senie, “Network Ingress Filtering: Defeating Denial 
of Service Attacks which Employ IP Source Address Spoofing,” RFC 2827, May 
2000. 


[RFC 2865] C. Rigney, S. Willens, A. Rubens, W. Simpson, “Remote Authentica- 
tion Dial In User Service (RADIUS),” RFC 2865, June 2000, 


[RFC 3007] B. Wellington, “Secure Domain Name System (DNS) Dynamic 
Update,” RFC 3007, Nov. 2000. 


[RFC 3022] P. Srisuresh, K. Egevang, “Traditional IP Network Address Translator 
(Traditional NAT),” RFC 3022, Jan. 2001. 


[RFC 3022] P. Srisuresh, K. Egevang, “Traditional IP Network Address Translator 
(Traditional NAT),” RFC 3022, Jan. 2001. 


[RFC 3031] E. Rosen, A. Viswanathan, R. Callon, “Multiprotocol Label Switching 
Architecture,” RFC 3031, Jan. 2001. 


[RFC 3032] E. Rosen, D. Tappan, G. Fedorkow, Y. Rekhter, D. Farinacci, T. Li, 
A. Conta, “MPLS Label Stack Encoding,” RFC 3032, Jan. 2001. 


[RFC 3168] K. Ramakrishnan, S. Floyd, D. Black, “The Addition of Explicit Con- 
gestion Notification (ECN) to IP,” RFC 3168, Sept. 2001. 


[RFC 3209] D. Awduche, L. Berger, D. Gan, T. Li, V. Srinivasan, G. Swallow, 
“RSVP-TE: Extensions to RSVP for LSP Tunnels,” RFC 3209, Dec. 2001. 


[RFC 3221] G. Huston, “Commentary on Inter-Domain Routing in the Internet,” 
RFC 3221, Dec. 2001. 


[RFC 3232] J. Reynolds, “Assigned Numbers: RFC 1700 Is Replaced by an On- 
line Database,” RFC 3232, Jan. 2002. 


[RFC 3234] B. Carpenter, S. Brim, “Middleboxes: Taxonomy and Issues,” RFC 
3234, Feb. 2002. 


[RFC 3246] B. Davie, A. Charny, J.C.R. Bennet, K. Benson, J.Y. Le Boudec, W. 
Courtney, S. Davari, V. Firoiu, D. Stiliadis, “An Expedited Forwarding PHB 
(Per-Hop Behavior), RFC 3246, Mar. 2002. 


[RFC 3260] D. Grossman, “New Terminology and Clarifications for Diffserv,” 
RFC 3260, Apr. 2002. 


[RFC 3261] J. Rosenberg, H. Schulzrinne, G. Carmarillo, A. Johnston, J. Peterson, 
R. Sparks, M. Handley, E. Schooler, “SIP: Session Initiation Protocol,” RFC 3261, 
July 2002. 


[RFC 3272] J. Boyle, V. Gill, A. Hannan, D. Cooper, D. Awduche, B. Christian, 
W. S. Lai, “Overview and Principles of Internet Traffic Engineering,” RFC 3272, 
May 2002. 


[RFC 3286] L. Ong, J. Yoakum, “An Introduction to the Stream Control Transmis- 
sion Protocol (SCTP),” RFC 3286, May 2002. 


[RFC 3346] J. Boyle, V. Gill, A. Hannan, D. Cooper, D. Awduche, B. Christian, 
W. S. Lai, “Applicability Statement for Traffic Engineering with MPLS,” RFC 
3346, Aug. 2002. 


参考 文献 





[RFC 3390] M. Aliman, S. Floyd, C. Partridge, “Increasing TCP’s Initial 
Window,” RFC 3390, Oct. 2002. 


[RFC 3410] J. Case, R. Mundy, D. Partain, “Introduction and Applicability State- 
ments for Internet Standard Management Framework,” RFC 3410, Dec. 2002. 


[RFC 3414] U. Blumenthal and B. Wijnen, “User-based Security Model (USM) for 
Version 3 of the Simple Network Management Protocol (SNMPv3),” RFC 3414, 
Dec. 2002. 


[RFC 3416] R. Presuhn, J. Case, K. McCloghrie, M. Rose, S. Waldbusser, “Ver- 
sion 2 of the Protocol Operations for the Simple Network Management Protocol 
(SNMP),” Dec. 2002. 


[RFC 3439] R. Bush, D. Meyer, “Some Internet Architectural Guidelines and Phi- 
losophy,” RFC 3439, Dec. 2003. 


[RFC 3447] J. Jonsson, B. Kaliski, “Public-Key Cryptography Standards (PKCS) 
#1: RSA Cryptography Specifications Version 2.1,” RFC 3447, Feb. 2003. 


[RFC 3468] L. Andersson, G. Swallow, “The Multiprotocol Label Switching 
(MPLS) Working Group Decision on MPLS Signaling Protocols,” RFC 3468, 
Feb. 2003. 


[RFC 3469] V. Sharma, Ed., F. Hellstrand, Ed, “Framework for Multi-Protocol 
Label Switching (MPLS)-based Recovery,” RFC 3469, Feb. 2003. 
ftp://ftp.rfe-editor.org/in-notes/rfc3469.txt 


[RFC 3501] M. Crispin, “Internet Message Access Protocol—Version 4rev1,” RFC 
3501, Mar. 2003. 


[RFC 3550] H. Schulzrinne, S. Casner, R. Frederick, V. Jacobson, “RTP: A Trans- 
port Protocol for Real-Time Applications,” RFC 3550, July 2003. 


[RFC 3588] P. Calhoun, J. Loughney, E. Guttman, G. Zorn, J. Arkko, “Diameter 
Base Protocol,” RFC 3588, Sept. 2003. 


[RFC 3649] S. Floyd, “HighSpeed TCP for Large Congestion Windows,” RFC 
3649, Dec. 2003. 


[RFC 3746] L. Yang, R. Dantu, T. Anderson, R. Gopal, “Forwarding and Control 
Element Separation (ForCES) Framework,” Internet, RFC 3746, Apr. 2004. 


[RFC 3748] B. Aboba, L. Blunk, J. Vollbrecht, J. Carlson, H. Levkowetz, Ed., 
“Extensible Authentication Protocol (EAP),” RFC 3748, June 2004. 


[RFC 3782] S. Floyd, T. Henderson, A. Gurtov, “The NewReno Modification to 
TCP’s Fast Recovery Algorithm,” RFC 3782, Apr. 2004. 


[RFC 4213] E. Nordmark, R. Gilligan, “Basic Transition Mechanisms for IPv6 
Hosts and Routers,” RFC 4213, Oct. 2005. 


[RFC 4271] Y. Rekhter, T. Li, S. Hares, Ed., “A Border Gateway Protocol 4 (BGP- 
4),” RFC 4271, Jan. 2006. 


[RFC 4272] S. Murphy, “BGP Security Vulnerabilities Analysis,’ RFC 4274, Jan. 
2006. 


[RFC 4291] R. Hinden, S. Deering, “IP Version 6 Addressing Architecture,” RFC 
4291, Feb. 2006. 


[RFC 4340] E. Kohler, M. Handley, S. Floyd, “Datagram Congestion Control 
Protocol (DCCP),” RFC 4340, Mar. 2006. 


[RFC 4443] A. Conta, S. Deering, M. Gupta, Ed., “Internet Control Message Pro- 
tocol (ICMP v6) for the Internet Protocol Version 6 (IPv6) Specification,” 


503 


504 参考 文献 








RFC 4443, Mar. 2006. 


[RFC 4346] T. Dierks, E. Rescorla, “The Transport Layer Security (TLS) Protocol 
Version 1.1,” RFC 4346, Apr. 2006. 


[RFC 4514] K. Zeilenga, Ed., “Lightweight Directory Access Protocol (LDAP): 
String Representation of Distinguished Names,” RFC 4514, June 2006. 


[RFC 4601] B. Fenner, M. Handley, H. Holbrook, I. Kouvelas, “Protocol 
Independent Multicast—Sparse Mode (PIM-SM): Protocol Specification 
(Revised),” RFC 4601, Aug. 2006. 


[RFC 4632] V. Fuller, T. Li, “Classless Inter-domain Routing (CIDR): The Inter- 
net Address Assignment and Aggregation Plan,” RFC 4632, Aug. 2006. 


[RFC 4960] R. Stewart, ed., “Stream Control Transmission Protocol,” RFC 4960, 
Sept. 2007. 


[RFC 4987] W. Eddy, “TCP SYN Flooding Attacks and Common Mitigations,” 
RFC 4987, Aug. 2007. 


[RFC 5000] RFC editor, “Internet Official Protocol Standards,” RFC 5000, May 
2008. 


[RFC 5109] A. Li (ed.), “RTP Payload Format for Generic Forward Error Correc- 
tion,” RFC 5109, Dec. 2007. 


[RFC 5216] D. Simon, B. Aboba, R. Hurst, “The EAP-TLS Authentication Proto- 
col,” RFC 5216, Mar. 2008. 


[RFC 5218] D. Thaler, B. Aboba, “What Makes for a Successful Protocol?,”” RFC 
5218, July 2008. 


[RFC 5321] J. Klensin, “Simple Mail Transfer Protocol,” RFC 5321, Oct. 2008. 
[RFC 5322] P. Resnick, Ed., “Internet Message Format,” RFC 5322, Oct. 2008. 


[RFC 5348] S. Floyd, M. Handley, J. Padhye, J. Widmer, “TCP Friendly Rate 
Control (TFRC): Protocol Specification,” RFC 5348, Sept. 2008. 


[RFC 5389] J. Rosenberg, R. Mahy, P. Matthews, D. Wing, “Session Traversal 
Utilities for NAT (STUN),” RFC 5389, Oct. 2008. 


[RFC 5411] J Rosenberg, “A Hitchhiker’s Guide to the Session Initiation Protocol 
(SIP),” RFC 5411, Feb. 2009. 


[RFC 5681] M. Allman, V. Paxson, E. Blanton, “TCP Congestion Control,” RFC 
5681, Sept. 2009. 


[RFC 5944] C. Perkins, Ed., “IP Mobility Support for IPv4, Revised,” RFC 5944, 
Nov. 2010. 


[RFC 6265] A Barth, “HTTP State Management Mechanism,” RFC 6265, Apr. 
2011. 


[RFC 6298] V. Paxson, M. Allman, J. Chu, M. Sargent, “Computing TCP’s Re- 
transmission Timer,” RFC 6298, June 2011. 


[RFC 7020] R. Housley, J. Curran, G. Huston, D. Conrad, “The Internet Numbers 
Registry System,” RFC 7020, Aug. 2013. 


[RFC 7094] D. McPherson, D. Oran, D. Thaler, E. Osterweil, “Architectural Con- 
siderations of IP Anycast,” RFC 7094, Jan. 2014. 


[RFC 7323] D. Borman, R. Braden, V. Jacobson, R. Scheffenegger (ed.), “TCP 
Extensions for High Performance,” RFC 7323, Sept. 2014. 


[RFC 7540] M. Belshe, R. Peon, M. Thomson (Eds), “Hypertext Transfer Protocol 


参考 文献 





Version 2 (HTTP/2),” RFC 7540, May 2015. 


[Richter 2015] P. Richter, M. Allman, R. Bush, V. Paxson, “A Primer on IPv4 
Scarcity,” ACM SIGCOMM Computer Communication Review, Vol. 45,-No. 2 
(Apr. 2015), pp. 21-32. 


[Roberts 1967] L. Roberts, T. Merril, “Toward a Cooperative Network of Time- 
Shared Computers,” AFIPS Fall Conference (Oct. 1966). 


[Rodriguez 2010] R. Rodrigues, P. Druschel, “Peer-to-Peer Systems,” Communi- 
cations of the ACM, Vol. 53, No. 10 (Oct. 2010), pp. 72-82. 


[Rohde 2008] Rohde, Schwarz, “UMTS Long Term Evolution (LTE) Technology 
Introduction,” Application Note IMA111. 


[Rom 1990] R. Rom, M. Sidi, Multiple Access Protocols: Performance and Analy- 
sis, Springer-Verlag, New York, 1990. 


[Root Servers 2016] Root Servers home page, http://www.root-servers.org/ 


[RSA 1978] R. Rivest, A. Shamir, L. Adelman, “A Method for Obtaining Digital 
Signatures and Public-key Cryptosystems,” Communications of the ACM, Vol. 21, 
No. 2 (Feb. 1978), pp. 120-126. 


[RSA Fast 2012] RSA Laboratories, “How Fast Is RSA?” http://www.rsa.com/ 
rsalabs/node.asp?id=2215 


[RSA Key 2012] RSA Laboratories, “How Large a Key Should Be Used in the 
RSA Crypto System?” http://www.rsa.com/rsalabs/node.asp?id=2218 


[Rubenstein 1998] D. Rubenstein, J. Kurose, D. Towsley, “Real-Time Reliable 
Multicast Using Proactive Forward Error Correction,” Proceedings of NOSSDAV 
‘98 (Cambridge, UK, July 1998). 


[Ruiz-Sanchez 2001] M. Ruiz-Sanchez, E. Biersack, W. Dabbous, “Survey and 
Taxonomy of IP Address Lookup Algorithms,” JEEE Network Magazine, Vol. 15, 
No. 2 (Mar./Apr. 2001), pp. 8-23. 


[Saltzer 1984] J. Saltzer, D. Reed, D. Clark, “End-to-End Arguments in System 
Design,” ACM Transactions on Computer Systems (TOCS), Vol. 2, No. 4 (Nov. 
1984). 


[Sandvine 2015] “Global Internet Phenomena Report, Spring 2011,” http://www. 
sandvine.com/news/global broadband trends.asp, 2011. 


[Sardar 2006] B. Sardar, D. Saha, “A Survey of TCP Enhancements for Last-Hop 
Wireless Networks,” JEEE Commun. Surveys and Tutorials, Vol. 8, No. 3 (2006), 
pp. 20-34. 


[Saroiu 2002] S. Saroiu, P. K. Gummadi, S. D. Gribble, “A Measurement Study of 
Peer-to-Peer File Sharing Systems,” Proc. of Multimedia Computing and Network- 
ing (MMCN) (2002). 


[Sauter 2014] M. Sauter, From GSM to LTE-Advanced, John Wiley and Sons, 
2014. 


[Savage 2015] D. Savage, J. Ng, S. Moore, D. Slice, P. Paluch, R. White, 
“Enhanced Interior Gateway Routing Protocol,” Internet Draft, draft- 
savage-eigrp-04.txt, Aug. 2015. 


[Saydam 1996] T. Saydam, T. Magedanz, “From Networks and Network Man- 
agement into Service and Service Management,” Journal of Networks and System 
Management, Vol. 4, No. 4 (Dec. 1996), pp. 345-348. 


505 


506 参考 文献 





[Schiller 2003] J. Schiller, Mobile Communications 2nd edition, Addison Wesley, 
2003. 


[Schneier 1995] B. Schneier, Applied Cryptography: Protocols, Algorithms, and 
Source Code in C, John Wiley and Sons, 1995. 


[Schulzrinne-RTP 2012] Henning Schulzrinne’s RTP site, http://www.cs.columbia 
.edu/~hgs/rtp 


[Schulzrinne-SIP 2016] Henning Schulzrinne’s SIP site, http://www.cs.columbia. 
edu/~hgs/sip 


[Schwartz 1977] M. Schwartz, Computer-Communication Network Design and 
Analysis, Prentice-Hall, Englewood Cliffs, NJ, 1997. 


[Schwartz 1980] M. Schwartz, Information, Transmission, Modulation, and Noise, 
McGraw Hill, New York, NY 1980. 


[Schwartz 1982] M. Schwartz, “Performance Analysis of the SNA Virtual Route 
Pacing Control,” JEEE Transactions on Communications, Vol. 30, No. 1 (Jan. 
1982), pp. 172-184. 


[Scourias 2012] J. Scourias, “Overview of the Global System for Mobile Commu- 
nications: GSM.” http://www. privateline.com/PCS/GSMO0.html 


[SDNHub 2016] SDNHub, “App Development Tutorials,” http://sdnhub.org/ 
tutorials/ 


[Segaller 1998] S. Segaller, Nerds 2.0.1, A Brief History of the Internet, TV Books, 
New York, 1998. 


[Sekar 2011] V. Sekar, S. Ratnasamy, M. Reiter, N. Egi, G. Shi, “ The Middle- 
box Manifesto: Enabling Innovation in Middlebox Deployment,” Proc. 10th ACM 
Workshop on Hot Topics in Networks (HotNets), Article 21, 6 pages. 


[Serpanos 2011] D. Serpanos, T. Wolf, Architecture of Network Systems, Morgan 
Kaufmann Publishers, 2011. 


[Shacham 1990] N. Shacham, P. McKenney, “Packet Recovery in High-Speed 
Networks Using Coding and Buffer Management,” Proc. 1990 IEEE INFOCOM 
(San Francisco, CA, Apr. 1990), pp. 124-131. 


[Shaikh 2001] A. Shaikh, R. Tewari, M. Agrawal, “On the Effectiveness of DNS- 
based Server Selection,” Proc. 2001 IEEE INFOCOM. 


[Singh 1999] S. Singh, The Code Book: The Evolution of Secrecy from Mary, 
Queen of Scotsto Quantum Cryptography, Doubleday Press, 1999. 


[Singh 2015] A. Singh, J. Ong,. Agarwal, G. Anderson, A. Armistead, R. Banno, S. 
Boving, G. Desai, B. Felderman, P. Germano, A. Kanagala, J. Provost, J. Simmons, 
E. Tanda, J. Wanderer, U. Hölzle, S. Stuart, A. Vahdat, “Jupiter Rising: A Decade 
of Clos Topologies and Centralized Control in Google’s Datacenter Network,” 
Sigcomm, 2015. 


[SIP Software 2016] H. Schulzrinne Software Package site, http://www. 
cs.columbia.edu/IRT/software 


[Skoudis 2004] E. Skoudis, L. Zeltser, Malware: Fighting Malicious Code, Pren- 
tice Hall, 2004. 


[Skoudis 2006] E. Skoudis, T. Liston, Counter Hack Reloaded: A Step-by-Step 
Guide to Computer Attacks and Effective Defenses (2nd Edition), Prentice Hall, 
2006. 


[Smith 2009] J. Smith, “Fighting Physics: A Tough Battle,” Communications of the 
ACM, Vol. 52, No. 7 (July 2009), pp. 60—65. 


参考 文献 








[Snort 2012] Sourcefire Inc., Snort homepage, http://http://www.snort.org/ 


[Solensky 1996] F. Solensky, “IPv4 Address Lifetime Expectations,” in IPng: 
Internet Protocol Next Generation (S. Bradner, A. Mankin, ed.), Addison-Wesley, 
Reading, MA, 1996. 


[Spragins 1991] J. D. Spragins, Telecommunications Protocols and Design, 
Addison-Wesley, Reading, MA, 1991. 


[Srikant 2004] R. Srikant, The Mathematics of Internet Congestion Control, 
Birkhauser, 2004 


[Steinder 2002] M. Steinder, A. Sethi, “Increasing Robustness of Fault Localiza- 
tion Through Analysis of Lost, Spurious, and Positive Symptoms,” Proc. 2002 
IEEE INFOCOM. 


[Stevens 1990] W. R. Stevens, Unix Network Programming, Prentice-Hall, Engle- 
wood Cliffs, NJ. 


[Stevens 1994] W. R. Stevens, TCP/IP Illustrated, Vol. 1: The Protocols, Addison- 
Wesley, Reading, MA, 1994. 


[Stevens 1997] W.R. Stevens, Unix Network Programming, Volume 1: Networking 
APIs-Sockets and XTI, 2nd edition, Prentice-Hall, Englewood Cliffs, NJ, 1997. 


[Stewart 1999] J. Stewart, BGP4: Interdomain Routing in the Internet, Addison- 
Wesley, 1999. 


[Stone 1998] J. Stone, M. Greenwald, C. Partridge, J. Hughes, “Performance of 
Checksums and CRC’s Over Real Data,” IEEE/ACM Transactions on Networking, 
Vol. 6, No. 5 (Oct. 1998), pp. 529-543. 


[Stone 2000] J. Stone, C. Partridge, “When Reality and the Checksum Disagree,” 
Proc. 2000 ACM SIGCOMM (Stockholm, Sweden, Aug. 2000). 


[Strayer 1992] W. T. Strayer, B. Dempsey, A. Weaver, XTP: The Xpress Transfer 
Protocol, Addison-Wesley, Reading, MA, 1992. 


[Stubblefield 2002] A. Stubblefield, J. Ioannidis, A. Rubin, “Using the Fluhrer, 
Mantin, and Shamir Attack to Break WEP,” Proceedings of 2002 Network and 
Distributed Systems Security Symposium (2002), pp. 17-22. 


[Subramanian 2000] M. Subramanian, Network Management: Principles and 
Practice, Addison-Wesley, Reading, MA, 2000. 


[Subramanian 2002] L. Subramanian, S. Agarwal, J. Rexford, R. Katz, “Charac- 
terizing the Internet Hierarchy from Multiple Vantage Points,” Proc. 2002 IEEE 
INFOCOM. 


[Sundaresan 2006] K.Sundaresan, K. Papagiannaki, “The Need for Cross-layer 
Information in Access Point Selection,” Proc. 2006 ACM Internet Measurement 
Conference (Rio De Janeiro, Oct. 2006). 


[Suh 2006] K. Suh, D. R. Figueiredo, J. Kurose and D. Towsley, “Characterizing 
and Detecting Relayed Traffic: A Case Study Using Skype,” Proc. 2006 IEEE 
INFOCOM (Barcelona, Spain, Apr. 2006). 


[Sunshine 1978] C. Sunshine, Y. Dalal, “Connection Management in Transport 
Protocols,” Computer Networks, North-Holland, Amsterdam, 1978. 


[Tarig 2008] M. Tariq, A. Zeitoun, V. Valancius, N. Feamster, M. Ammar, “An- 
swering What-If Deployment and Configuration Questions with WISE,” Proc. 2008 
ACM SIGCOMM (Aug. 2008). 


[TechnOnLine 2012] TechOnLine, “Protected Wireless Networks,” online 
webcast tutorial, http://www.techonline.com/community/tech_topic/internet/21752 


507 


508 


参考 文献 





[Teixeira 2006] R. Teixeira, J. Rexford, “Managing Routing Disruptions in Inter- 
net Service Provider Networks,” IEEE Communications Magazine (Mar. 2006). 


[Think 2012] Technical History of Network Protocols, “Cyclades,” http://www. 
cs.utexas,edu/users/chris/think/Cyclades/index.shtml 


[Tian 2012] Y. Tian, R. Dey, Y. Liu, K. W. Ross, “China’s Internet: Topology 
Mapping and Geolocating,” IEEE INFOCOM Mini-Conference 2012 (Orlando, FL, 
2012). 


[TLD list 2016] TLD list maintained by Wikipedia, https://en.wikipedia.org/wiki/ 
List_of_Internet_top-level_domains 


[Tobagi 1990] F. Tobagi, “Fast Packet Switch Architectures for Broadband Inte- 
grated Networks,” Proc. 1990 IEEE INFOCOM, Vol. 78, No. 1 (Jan. 1990), pp. 
133-167. 


[TOR 2016] Tor: Anonymity Online, http://www.torproject.org 


[Torres 2011] R. Torres, A. Finamore, J. R. Kim, M. M. Munafo, S. Rao, “Dissect- 
ing Video Server Selection Strategies in the YouTube CDN,” Proc. 2011 Int. Conf. 
on Distributed Computing Systems. 


[Tourrilhes 2014] J. Tourrilhes, P. Sharma, S. Banerjee, J. Petit, “SDN and Open- 
flow Evolution: A Standards Perspective,” JEEE Computer Magazine, Nov. 2014, 
pp. 22-29. 


[Turner 1988] J. S. Turner, “Design of a Broadcast packet switching network,” 
IEEE Transactions on Communications, Vol. 36, No. 6 (June 1988), pp. 734-743. 


[Turner 2012] B. Turner, “2G, 3G, 4G Wireless Tutorial,” http://blogs.nmscom- 
munications.com/communications/2008/10/2g-3g-4g-wireless-tutorial.html 


[UPnP Forum 2016] UPnP Forum homepage, http://www.upnp.org/ 


[van der Berg 2008] R. van der Berg, “How the 'Net Works: An Introduction to 
Peering and Transit,” http://arstechnica.com/guides/other/peering-and-transit.ars 


[van der Merwe 1998] J. van der Merwe, S. Rooney, I. Leslie, S. Crosby, “The 
Tempest: A Practical Framework for Network Programmability,” JEEE Network, 
Vol. 12, No. 3 (May 1998), pp. 20-28. 


[Varghese 1997] G. Varghese, A. Lauck, “Hashed and Hierarchical Timing 
Wheels: Efficient Data Structures for Implementing a Timer Facility,” JEEE/ACM 
Transactions on Networking, Vol. 5, No. 6 (Dec. 1997), pp. 824-834. 


[Vasudevan 2012] S. Vasudevan, C. Diot, J. Kurose, D. Towsley, “Facilitating Ac- 
cess Point Selection in IEEE 802.11 Wireless Networks,” Proc. 2005 ACM Internet 
Measurement Conference, (San Francisco CA, Oct. 2005). 


[Villamizar 1994] C. Villamizar, C. Song. “High Performance TCP in ANSNET,” 
ACM SIGCOMM Computer Communications Review, Vol. 24, No. 5 (1994), 
pp. 45-60. 


[Viterbi 1995] A. Viterbi, CDMA: Principles of Spread Spectrum Communication, 
Addison-Wesley, Reading, MA, 1995. 


[Vixie 2009] P. Vixie, “What DNS Is Not,” Communications of the ACM, Vol. 52, 
No. 12 (Dec. 2009), pp. 43-47. 


[Wakeman 1992] I. Wakeman, J. Crowcroft, Z. Wang, D. Sirovica, “Layering 
Considered Harmful,” IEEE Network (Jan. 1992), pp. 20-24. 


[Waldrop 2007] M. Waldrop, “Data Center in a Box,” Scientific American (July 
2007). 


参考 文献 





[Wang 2004] B. Wang, J. Kurose, P. Shenoy, D. Towsley, “Multimedia Streaming 
via TCP: An Analytic Performance Study,” Proc. 2004 ACM Multimedia Confer- 
ence (New York, NY, Oct. 2004). 


[Wang 2008] B. Wang, J. Kurose, P. Shenoy, D. Towsley, “Multimedia Streaming 
via TCP: An Analytic Performance Study,” ACM Transactions on Multimedia 
Computing Communications and Applications (TOMCCAP), Vol. 4, No. 2 (Apr. 
2008), p. 16. 1-22. 


[Wang 2010] G. Wang, D. G. Andersen, M. Kaminsky, K. Papagiannaki, T. S. E. 
Ng, M. Kozuch, M. Ryan, “c-Through: Part-time Optics in Data Centers,” Proc. 
2010 ACM SIGCOMM. 


[Wei 2006] W. Wei, C. Zhang, H. Zang, J. Kurose, D. Towsley, “Inference and 
Evaluation of Split-Connection Approaches in Cellular Data Networks,” Proc. 
Active and Passive Measurement Workshop (Adelaide, Australia, Mar. 2006). 


[Wei 2007] D. X. Wei, C. Jin, S. H. Low, S. Hegde, “FAST TCP: Motivation, 
Architecture, Algorithms, Performance,” IEEE/ACM Transactions on Networking 
(2007). 


[Weiser 1991] M. Weiser, “The Computer for the Twenty-First Century,” 
Scientific American (Sept. 1991): 94-10. http://www.ubiq.com/hypertext/weiser/ 
SciAmDraft3.html 


[White 2011] A. White, K. Snow, A. Matthews, F. Monrose, “Hookt on fon-iks: 
Phonotactic Reconstruction of Encrypted VoIP Conversations,” JEEE Symposium 
on Security and Privacy, Oakland, CA, 2011. 


[Wigle.net 2016] Wireless Geographic Logging Engine, http://www.wigle.net 


[Wiki Satellite 2016] Satellite Internet access, https://en.wikipedia.org/wiki/Satel- 
lite_Internet_access 


[Wireshark 2016] Wireshark homepage, http://www.wireshark.org 


[Wischik 2005] D. Wischik, N. McKeown, “Part I: Buffer Sizes for Core 
Routers,” ACM SIGCOMM Computer Communications Review, Vol. 35, No. 3 
(July 2005). 


[Woo 1994] T. Woo, R. Bindignavle, S. Su, S. Lam, “SNP: an interface for secure 
network programming,” Proc. 1994 Summer USENIX (Boston, MA, June 1994), 
pp. 45-58. 


[Wright 2015] J. Wright, J. Wireless Security Secrets & Solutions, 3e, “Hacking 
Exposed Wireless,” McGraw-Hill Education, 2015. 


[Wu 2005] J. Wu, Z. M. Mao, J. Rexford, J. Wang, “Finding a Needle in a Hay- 
stack: Pinpointing Significant BGP Routing Changes in an IP Network,” Proc. 
USENIX NSDI (2005). 


[Xanadu 2012] Xanadu Project homepage, http://www.xanadu.com/ 


[Xiao 2000] X. Xiao, A. Hannan, B. Bailey, L. Ni, “Traffic Engineering with 
MPLS in the Internet,” JEEE Network (Mar./Apr. 2000). 


[Xu 2004] L. Xu, K Harfoush, I. Rhee, “Binary Increase Congestion Control (BIC) 
for Fast Long-Distance Networks,” JEEE INFOCOM 2004, pp. 2514-2524. 


[Yavatkar 1994] R. Yavatkar, N. Bhagwat, “Improving End-to-End Performance 
of TCP over Mobile Internetworks,” Proc. Mobile 94 Workshop on Mobile Com- 
puting Systems and Applications (Dec. 1994). 


[YouTube 2009] YouTube 2009, Google container data center tour, 2009. 


509 


510 


KA TX ak 





[YouTube 2016] YouTube Statistics, 2016, https://www.youtube.com/yt/press/ 
statistics. html 


[Yu 2004] Yu, Fang, H. Katz, Tirunellai V. Lakshman. “Gigabit Rate Packet 
Pattern-Matching Using TCAM,” Proc. 2004 Int. Conf. Network Protocols, 
pp. 174-183. 


[Yu 2011] M. Yu, J. Rexford, X. Sun, S. Rao, N. Feamster, “A Survey of VLAN 
Usage in Campus Networks,” JEEE Communications Magazine, July 2011. 


[Zegura 1997] E. Zegura, K. Calvert, M. Donahoo, “A Quantitative Comparison of 
Graph-based Models for Internet Topology,” JEEE/ACM Transactions on Network- 
ing, Vol. 5, No. 6, (Dec. 1997). See also http://www.cc.gatech.edu/projects/gtim for 
a software package that generates networks with a transit-stub structure. 


[Zhang 1993] L. Zhang, S. Deering, D. Estrin, S. Shenker, D. Zappala, “RSVP: 
A New Resource Reservation Protocol,” JEEE Network Magazine, Vol. 7, No. 9 
(Sept. 1993), pp. 8-18. 


[Zhang 2007] L. Zhang, “A Retrospective View of NAT,” The IETF Journal, Vol. 
3, Issue 2 (Oct. 2007). 


[Zhang 2015] G. Zhang, W. Liu, X. Hei, W. Cheng, “Unreeling Xunlei Kankan: 
Understanding Hybrid CDN-P2P Video-on-Demand Streaming,” JEEE Transac- 
tions on Multimedia, Vol. 17, No. 2, Feb. 2015. 


[Zhang X 2102] X. Zhang, Y. Xu, Y. Liu, Z. Guo, Y. Wang, “Profiling Skype 
Video Calls: Rate Control and Video Quality,” JEEE INFOCOM (Mar. 2012). 


[Zink 2009] M. Zink, K. Suh, Y. Gu, J. Kurose, “Characteristics of YouTube Network 
Traffic at a Campus Network—Measurements, Models, and Implications,” Computer 
Networks, Vol. 53, No. 4, pp. 501-514, 2009. 








计算 机 网 络 自 项 向 下 方法 原 书 第 7 版 


Computer Networking A Top-Down Approach Seventh Edition 


本 书 自首 次 出 版 以 来 已 被 译 为 14 种 语言 ， 世 界 上 数 百 所 大 学 采用 本 书 作为 教材 ;有 几 十 万 学 生 和 从 业 人 员 利 
用 本 书 系 统 学 习 计 算 机 网 络 的 知识 。 本 书 已 成 为 学 习 计 算 机 网 络 知识 的 必 读 教材 之 一 。 


主要 特点 


@ 自 顶 向 下 方法 。 本 书 采用 作者 独创 的 “ 自 顶 向 下 方法 ”讲授 计算 机 网 络 的 原理 及 其 协议 ， 即 从 应 用 层 协 议 开始 
沿 协议 栈 向 下 讲解 ， 让 读者 从 实现 、 应 用 的 角度 理解 各 层 的 意义 ， 强 调 应 用 层 范例 和 应 用 编程 接口 ， 使 读者 尽 
快 进入 每 天 使 用 的 应 用 程序 环境 之 中 进行 学 习 和 创造 。 

@ 以 因特网 为 研究 目标 。 因 特 网 已 经 变 得 无 所 不 在 ， 任 何 网 络 教科 书 必须 关注 因特网 。 本 书 以 因特网 的 体系 结构 
和 协议 为 载体 讲授 基本 的 计算 机 网 络 概念 ， 这 有 助 于 激发 学 生 学 习 网 络 基本 原理 的 积极 性 ， 并 理解 原理 的 实际 
应 用 。 

o 聚焦 网 络 原理 。 网 络 领域 已 经 发 展 得 相当 成 熟 ， 沉 淀 出 很 多 基础 性 的 重要 问题 。 本 书 在 梳理 这 些 问 题 的 同时 ， 
详细 介绍 了 解决 问题 的 方法 。 用 因特网 将 学 生 引 六 网 络 之 门 后 ， 再 结合 这 些 基础 性 问题 及 其 解决 方案 ; 学 生 便 
可 以 迅速 理解 几乎 任何 网 络 技术 。 

© 及 时 更 新 教学 内 容 。 本 书 根据 近年 来 计算 机 网 络 的 进展 ， 对 内 容 进行 了 全 面 更 新 ， 包 括 用 两 章 的 篇 幅 讨 论 网 络 
层 以 反映 软件 定义 网 络 (SDN) 的 重要 性 ， 删 除了 FTP 和 分 布 式 散 列表 的 内 容 ， 将 ATM 网 络 的 内 容 更 新 为 流行 
的 因特网 显 式 拥塞 通告 ( ECN ) 内 容 等 。 


作者 简介 


詹姆斯 - F. 库 罗斯 ( James F. Kurose ) 美国 马萨诸塞 大 学 阿 默 斯 特 分 校 计 算 机 科学 系 教授 ， 研 究 兴趣 包括 网 ， 


络 协 议和 体系 结构 、 网 络 测量 、 多 媒体 通信 以 及 建 模 和 性 能 评价 。 由 于 在 教育 领域 的 杰出 贡献 ， 他 获得 了 包括 IEEE 
Taylor Booth 教 育 奖章 在 内 的 多 个 教育 奖励 和 荣誉 。 他 是 IEEE 和 ACM 会 士 ， 还 曾 担任 《IEEE 通 全会 刊 》 和 CIEEE/ 
ACM 网 络 会 刊 》 总 编辑 。 


EA- W. PM (Keith W. Ross) 美国 纽约 天 学 ( NYU ) 上 海 分 校 工程 和 计算 机 科学 学 院 院 长 以 及 NYU 计 算 
机 科学 和 工程 系 的 Leonard JShustek 首 席 教 授 ， 研 究 兴趣 包括 隐私 .社交 网 络 、 对 等 网 络 、 因 特 网 测量 、 内 容 分 发 
网 络 和 随机 建 模 。 他 是 IEEE 和 ACM 会 士 ， 还 曾 获 得 Infocom 2009 年 优秀 论文 奖 以 及 《多 媒体 通信 》2011 年 和 2008 年 
优秀 论文 奖 。 


计算 机 \ 网 络 。 





P Pearson Opta 2 


www.pearson.com 华章 教育 服务 微 信号 





投稿 热线 : (010) 88379604 

客服 热线 ; (010) 88378991 88361066 . 

购书 热线 ; (010) 68326294 88379649 68995259 
SHINEE e 142 


华章 网 站 : www.hzbook.com 
网 上 购书 : www.china-pub.com 
数字 阅读 : www.hzmedia.com.cn 














